Installing Whisper

The commands below will install the Python packages needed to use Whisper models and evaluate the transcription results.

! pip install git+https://github.com/openai/whisper.git
! pip install jiwer
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting git+https://github.com/openai/whisper.git
  Cloning https://github.com/openai/whisper.git to /tmp/pip-req-build-secg28uw
  Running command git clone -q https://github.com/openai/whisper.git /tmp/pip-req-build-secg28uw
Requirement already satisfied: numpy in /usr/local/lib/python3.7/dist-packages (from whisper==1.0) (1.21.6)
Requirement already satisfied: torch in /usr/local/lib/python3.7/dist-packages (from whisper==1.0) (1.12.1+cu113)
Requirement already satisfied: tqdm in /usr/local/lib/python3.7/dist-packages (from whisper==1.0) (4.64.1)
Requirement already satisfied: more-itertools in /usr/local/lib/python3.7/dist-packages (from whisper==1.0) (8.14.0)
Collecting transformers>=4.19.0
  Downloading transformers-4.22.1-py3-none-any.whl (4.9 MB)
     |████████████████████████████████| 4.9 MB 10.1 MB/s 
Collecting ffmpeg-python==0.2.0
  Downloading ffmpeg_python-0.2.0-py3-none-any.whl (25 kB)
Requirement already satisfied: future in /usr/local/lib/python3.7/dist-packages (from ffmpeg-python==0.2.0->whisper==1.0) (0.16.0)
Collecting tokenizers!=0.11.3,<0.13,>=0.11.1
  Downloading tokenizers-0.12.1-cp37-cp37m-manylinux_2_12_x86_64.manylinux2010_x86_64.whl (6.6 MB)
     |████████████████████████████████| 6.6 MB 50.2 MB/s 
Collecting huggingface-hub<1.0,>=0.9.0
  Downloading huggingface_hub-0.9.1-py3-none-any.whl (120 kB)
     |████████████████████████████████| 120 kB 69.5 MB/s 
Requirement already satisfied: packaging>=20.0 in /usr/local/lib/python3.7/dist-packages (from transformers>=4.19.0->whisper==1.0) (21.3)
Requirement already satisfied: regex!=2019.12.17 in /usr/local/lib/python3.7/dist-packages (from transformers>=4.19.0->whisper==1.0) (2022.6.2)
Requirement already satisfied: filelock in /usr/local/lib/python3.7/dist-packages (from transformers>=4.19.0->whisper==1.0) (3.8.0)
Requirement already satisfied: importlib-metadata in /usr/local/lib/python3.7/dist-packages (from transformers>=4.19.0->whisper==1.0) (4.12.0)
Requirement already satisfied: requests in /usr/local/lib/python3.7/dist-packages (from transformers>=4.19.0->whisper==1.0) (2.23.0)
Requirement already satisfied: pyyaml>=5.1 in /usr/local/lib/python3.7/dist-packages (from transformers>=4.19.0->whisper==1.0) (6.0)
Requirement already satisfied: typing-extensions>=3.7.4.3 in /usr/local/lib/python3.7/dist-packages (from huggingface-hub<1.0,>=0.9.0->transformers>=4.19.0->whisper==1.0) (4.1.1)
Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in /usr/local/lib/python3.7/dist-packages (from packaging>=20.0->transformers>=4.19.0->whisper==1.0) (3.0.9)
Requirement already satisfied: zipp>=0.5 in /usr/local/lib/python3.7/dist-packages (from importlib-metadata->transformers>=4.19.0->whisper==1.0) (3.8.1)
Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.7/dist-packages (from requests->transformers>=4.19.0->whisper==1.0) (2022.6.15)
Requirement already satisfied: idna<3,>=2.5 in /usr/local/lib/python3.7/dist-packages (from requests->transformers>=4.19.0->whisper==1.0) (2.10)
Requirement already satisfied: urllib3!=1.25.0,!=1.25.1,<1.26,>=1.21.1 in /usr/local/lib/python3.7/dist-packages (from requests->transformers>=4.19.0->whisper==1.0) (1.24.3)
Requirement already satisfied: chardet<4,>=3.0.2 in /usr/local/lib/python3.7/dist-packages (from requests->transformers>=4.19.0->whisper==1.0) (3.0.4)
Building wheels for collected packages: whisper
  Building wheel for whisper (setup.py) ... done
  Created wheel for whisper: filename=whisper-1.0-py3-none-any.whl size=1174064 sha256=50c62e2d97ba16d2d08e6429da306f3faee9f7b9c8581ffac4ec215d5c30b082
  Stored in directory: /tmp/pip-ephem-wheel-cache-p8fgj_9g/wheels/16/15/89/1c7bb31bd0006793a95549d04785121a8a36daad9158e1e43a
Successfully built whisper
Installing collected packages: tokenizers, huggingface-hub, transformers, ffmpeg-python, whisper
Successfully installed ffmpeg-python-0.2.0 huggingface-hub-0.9.1 tokenizers-0.12.1 transformers-4.22.1 whisper-1.0
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting jiwer
  Downloading jiwer-2.5.1-py3-none-any.whl (15 kB)
Collecting levenshtein==0.20.2
  Downloading Levenshtein-0.20.2-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.4 MB)
     |████████████████████████████████| 1.4 MB 9.8 MB/s 
Collecting rapidfuzz<3.0.0,>=2.3.0
  Downloading rapidfuzz-2.10.0-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.6 MB)
     |████████████████████████████████| 1.6 MB 49.0 MB/s 
Collecting jarowinkler<2.0.0,>=1.2.0
  Downloading jarowinkler-1.2.1-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (104 kB)
     |████████████████████████████████| 104 kB 62.0 MB/s 
Installing collected packages: jarowinkler, rapidfuzz, levenshtein, jiwer
Successfully installed jarowinkler-1.2.1 jiwer-2.5.1 levenshtein-0.20.2 rapidfuzz-2.10.0

Loading the LibriSpeech dataset

The following will load the test-clean split of the LibriSpeech corpus using torchaudio.

import os
import numpy as np

try:
    import tensorflow  # required in Colab to avoid protobuf compatibility issues
except ImportError:
    pass

import torch
import pandas as pd
import whisper
import torchaudio

from tqdm.notebook import tqdm


DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
The cache for model files in Transformers v4.22.0 has been updated. Migrating your old cache. This is a one-time only operation. You can interrupt this and resume the migration later on by calling `transformers.utils.move_cache()`.
Moving 0 files to the new cache system
class LibriSpeech(torch.utils.data.Dataset):
    """
    A simple class to wrap LibriSpeech and trim/pad the audio to 30 seconds.
    It will drop the last few seconds of a very small portion of the utterances.
    """
    def __init__(self, split="test-clean", device=DEVICE):
        self.dataset = torchaudio.datasets.LIBRISPEECH(
            root=os.path.expanduser("~/.cache"),
            url=split,
            download=True,
        )
        self.device = device

    def __len__(self):
        return len(self.dataset)

    def __getitem__(self, item):
        audio, sample_rate, text, _, _, _ = self.dataset[item]
        assert sample_rate == 16000
        audio = whisper.pad_or_trim(audio.flatten()).to(self.device)
        mel = whisper.log_mel_spectrogram(audio)
        
        return (mel, text)
dataset = LibriSpeech("test-clean")
loader = torch.utils.data.DataLoader(dataset, batch_size=16)

Running inference on the dataset using a base Whisper model

The following will take a few minutes to transcribe all utterances in the dataset.

model = whisper.load_model("base.en")
print(
    f"Model is {'multilingual' if model.is_multilingual else 'English-only'} "
    f"and has {sum(np.prod(p.shape) for p in model.parameters()):,} parameters."
)
100%|████████████████████████████████████████| 139M/139M [00:01<00:00, 144MiB/s]
Model is English-only and has 71,825,408 parameters.
options = whisper.DecodingOptions(language="en", without_timestamps=True)
hypotheses = []
references = []

for mels, texts in tqdm(loader):
    results = model.decode(mels, options)
    hypotheses.extend([result.text for result in results])
    references.extend(texts)
data = pd.DataFrame(dict(hypothesis=hypotheses, reference=references))
data
hypothesis reference
0 He hoped there would be stew for dinner, turni... HE HOPED THERE WOULD BE STEW FOR DINNER TURNIP...
1 Stuffered into you, his belly counseled him. STUFF IT INTO YOU HIS BELLY COUNSELLED HIM
2 After early nightfall the yellow lamps would l... AFTER EARLY NIGHTFALL THE YELLOW LAMPS WOULD L...
3 Hello Bertie, any good in your mind? HELLO BERTIE ANY GOOD IN YOUR MIND
4 Number 10. Fresh Nelly is waiting on you. Good... NUMBER TEN FRESH NELLY IS WAITING ON YOU GOOD ...
... ... ...
2615 Oh, to shoot my soul's full meaning into futur... OH TO SHOOT MY SOUL'S FULL MEANING INTO FUTURE...
2616 Then I, long tried by natural ills, received t... THEN I LONG TRIED BY NATURAL ILLS RECEIVED THE...
2617 I love thee freely as men strive for right. I ... I LOVE THEE FREELY AS MEN STRIVE FOR RIGHT I L...
2618 I love thee with the passion put to use, in my... I LOVE THEE WITH THE PASSION PUT TO USE IN MY ...
2619 I love thee with the love I seemed to lose wit... I LOVE THEE WITH A LOVE I SEEMED TO LOSE WITH ...

2620 rows × 2 columns

Calculating the word error rate

Now, we use our English normalizer implementation to standardize the transcription and calculate the WER.

import jiwer
from whisper.normalizers import EnglishTextNormalizer

normalizer = EnglishTextNormalizer()
data["hypothesis_clean"] = [normalizer(text) for text in data["hypothesis"]]
data["reference_clean"] = [normalizer(text) for text in data["reference"]]
data
hypothesis reference hypothesis_clean reference_clean
0 He hoped there would be stew for dinner, turni... HE HOPED THERE WOULD BE STEW FOR DINNER TURNIP... he hoped there would be stew for dinner turnip... he hoped there would be stew for dinner turnip...
1 Stuffered into you, his belly counseled him. STUFF IT INTO YOU HIS BELLY COUNSELLED HIM stuffered into you his belly counseled him stuff it into you his belly counseled him
2 After early nightfall the yellow lamps would l... AFTER EARLY NIGHTFALL THE YELLOW LAMPS WOULD L... after early nightfall the yellow lamps would l... after early nightfall the yellow lamps would l...
3 Hello Bertie, any good in your mind? HELLO BERTIE ANY GOOD IN YOUR MIND hello bertie any good in your mind hello bertie any good in your mind
4 Number 10. Fresh Nelly is waiting on you. Good... NUMBER TEN FRESH NELLY IS WAITING ON YOU GOOD ... number 10 fresh nelly is waiting on you good n... number 10 fresh nelly is waiting on you good n...
... ... ... ... ...
2615 Oh, to shoot my soul's full meaning into futur... OH TO SHOOT MY SOUL'S FULL MEANING INTO FUTURE... 0 to shoot my soul is full meaning into future... 0 to shoot my soul is full meaning into future...
2616 Then I, long tried by natural ills, received t... THEN I LONG TRIED BY NATURAL ILLS RECEIVED THE... then i long tried by natural ills received the... then i long tried by natural ills received the...
2617 I love thee freely as men strive for right. I ... I LOVE THEE FREELY AS MEN STRIVE FOR RIGHT I L... i love thee freely as men strive for right i l... i love thee freely as men strive for right i l...
2618 I love thee with the passion put to use, in my... I LOVE THEE WITH THE PASSION PUT TO USE IN MY ... i love thee with the passion put to use in my ... i love thee with the passion put to use in my ...
2619 I love thee with the love I seemed to lose wit... I LOVE THEE WITH A LOVE I SEEMED TO LOSE WITH ... i love thee with the love i seemed to lose wit... i love thee with a love i seemed to lose with ...

2620 rows × 4 columns

wer = jiwer.wer(list(data["reference_clean"]), list(data["hypothesis_clean"]))

print(f"WER: {wer * 100:.2f} %")
WER: 4.26 %
import io
import os
import numpy as np

try:
    import tensorflow  # required in Colab to avoid protobuf compatibility issues
except ImportError:
    pass

import torch
import pandas as pd
import urllib
import tarfile
import whisper
import torchaudio

from scipy.io import wavfile
from tqdm.notebook import tqdm


pd.options.display.max_rows = 100
pd.options.display.max_colwidth = 1000
DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
DEVICE
'cuda'

Loading the Fleurs dataset

Select the language of the Fleur dataset to download. Please note that the transcription and translation performance varies widely depending on the language. Appendix D.2 in the paper contains the performance breakdown by language.

import ipywidgets as widgets

languages = {"af_za": "Afrikaans", "am_et": "Amharic", "ar_eg": "Arabic", "as_in": "Assamese", "az_az": "Azerbaijani", "be_by": "Belarusian", "bg_bg": "Bulgarian", "bn_in": "Bengali", "bs_ba": "Bosnian", "ca_es": "Catalan", "cmn_hans_cn": "Chinese", "cs_cz": "Czech", "cy_gb": "Welsh", "da_dk": "Danish", "de_de": "German", "el_gr": "Greek", "en_us": "English", "es_419": "Spanish", "et_ee": "Estonian", "fa_ir": "Persian", "fi_fi": "Finnish", "fil_ph": "Tagalog", "fr_fr": "French", "gl_es": "Galician", "gu_in": "Gujarati", "ha_ng": "Hausa", "he_il": "Hebrew", "hi_in": "Hindi", "hr_hr": "Croatian", "hu_hu": "Hungarian", "hy_am": "Armenian", "id_id": "Indonesian", "is_is": "Icelandic", "it_it": "Italian", "ja_jp": "Japanese", "jv_id": "Javanese", "ka_ge": "Georgian", "kk_kz": "Kazakh", "km_kh": "Khmer", "kn_in": "Kannada", "ko_kr": "Korean", "lb_lu": "Luxembourgish", "ln_cd": "Lingala", "lo_la": "Lao", "lt_lt": "Lithuanian", "lv_lv": "Latvian", "mi_nz": "Maori", "mk_mk": "Macedonian", "ml_in": "Malayalam", "mn_mn": "Mongolian", "mr_in": "Marathi", "ms_my": "Malay", "mt_mt": "Maltese", "my_mm": "Myanmar", "nb_no": "Norwegian", "ne_np": "Nepali", "nl_nl": "Dutch", "oc_fr": "Occitan", "pa_in": "Punjabi", "pl_pl": "Polish", "ps_af": "Pashto", "pt_br": "Portuguese", "ro_ro": "Romanian", "ru_ru": "Russian", "sd_in": "Sindhi", "sk_sk": "Slovak", "sl_si": "Slovenian", "sn_zw": "Shona", "so_so": "Somali", "sr_rs": "Serbian", "sv_se": "Swedish", "sw_ke": "Swahili", "ta_in": "Tamil", "te_in": "Telugu", "tg_tj": "Tajik", "th_th": "Thai", "tr_tr": "Turkish", "uk_ua": "Ukrainian", "ur_pk": "Urdu", "uz_uz": "Uzbek", "vi_vn": "Vietnamese", "yo_ng": "Yoruba"}
selection = widgets.Dropdown(
    options=[("Select language", None), ("----------", None)] + sorted([(f"{v} ({k})", k) for k, v in languages.items()]),
    value="ko_kr",
    description='Language:',
    disabled=False,
)

selection
lang = selection.value
language = languages[lang]

assert lang is not None, "Please select a language"
print(f"Selected language: {language} ({lang})")
Selected language: Chinese (cmn_hans_cn)
class Fleurs(torch.utils.data.Dataset):
    """
    A simple class to wrap Fleurs and subsample a portion of the dataset as needed.
    """
    def __init__(self, lang, split="test", subsample_rate=1, device=DEVICE):
        url = f"https://storage.googleapis.com/xtreme_translations/FLEURS102/{lang}.tar.gz"
        tar_path = os.path.expanduser(f"~/.cache/fleurs/{lang}.tgz")
        os.makedirs(os.path.dirname(tar_path), exist_ok=True)

        if not os.path.exists(tar_path):
            with urllib.request.urlopen(url) as source, open(tar_path, "wb") as output:
                with tqdm(total=int(source.info().get("Content-Length")), ncols=80, unit='iB', unit_scale=True, unit_divisor=1024) as loop:
                    while True:
                        buffer = source.read(8192)
                        if not buffer:
                            break

                        output.write(buffer)
                        loop.update(len(buffer))

        labels = {}
        all_audio = {}
        with tarfile.open(tar_path, "r:gz") as tar:
            for member in tar.getmembers():
                name = member.name
                if name.endswith(f"{split}.tsv"):
                    labels = pd.read_table(tar.extractfile(member), names=("id", "file_name", "raw_transcription", "transcription", "_", "num_samples", "gender"))

                if f"/{split}/" in name and name.endswith(".wav"):
                    audio_bytes = tar.extractfile(member).read()
                    all_audio[os.path.basename(name)] = wavfile.read(io.BytesIO(audio_bytes))[1]
                    

        self.labels = labels.to_dict("records")[::subsample_rate]
        self.all_audio = all_audio
        self.device = device

    def __len__(self):
        return len(self.labels)

    def __getitem__(self, item):
        record = self.labels[item]
        audio = torch.from_numpy(self.all_audio[record["file_name"]].copy())
        text = record["transcription"]
        
        return (audio, text)
dataset = Fleurs(lang, subsample_rate=10)  # subsample 10% of the dataset for a quick demo
small_dataset = Fleurs(lang, subsample_rate=1)  # subsample 1% of the dataset for a quick demo
dataset, small_dataset
(<__main__.Fleurs at 0x7fa62041dbd0>, <__main__.Fleurs at 0x7fa5ba4cbbd0>)
len(small_dataset.labels), len(dataset.labels)
(945, 95)
type(small_dataset.labels), small_dataset.labels[0]
(list,
 {'id': 1779,
  'file_name': '10325559490685159122.wav',
  'raw_transcription': '特朗普与土耳其总统雷杰普·塔伊普·埃尔多安(Recep Tayyip Erdoğan)通话后发表了声明。',
  'transcription': '特朗普与土耳其总统雷杰普·塔伊普·埃尔多安recep tayyip erdoğan通话后发表了声明',
  '_': '特 朗 普 与 土 耳 其 总 统 雷 杰 普 · 塔 伊 普 · 埃 尔 多 安 r e c e p | t a y y i p | e r d o ğ a n 通 话 后 发 表 了 声 明 |',
  'num_samples': 242560,
  'gender': 'MALE'})
type(small_dataset.all_audio)
dict
len(small_dataset.all_audio)
945
import random
random.choice(list(small_dataset.all_audio.items()))
('14665455542148263931.wav',
 array([0.0000000e+00, 0.0000000e+00, 0.0000000e+00, ..., 8.3088875e-05,
        5.1021576e-05, 6.8724155e-05], dtype=float32))

randaomly choose 10 training data

for i in range(10):
  file, raw_data = random.choice(list(small_dataset.all_audio.items()))
  print(file, len(raw_data))
  print(raw_data)
11545158540803261075.wav 212160
[ 0.0000000e+00  0.0000000e+00  0.0000000e+00 ...  3.6954880e-06
 -2.6524067e-05 -4.0173531e-05]
8107720956886769719.wav 81600
[0.         0.         0.         ... 0.00137931 0.00124866 0.00143242]
2625982748996855379.wav 222720
[0.0000000e+00 0.0000000e+00 0.0000000e+00 ... 9.5546246e-05 5.7399273e-05
 4.2498112e-05]
17251775862374398296.wav 96960
[ 4.1723251e-07 -4.7683716e-07  5.9604645e-07 ... -1.1312366e-03
 -1.0677576e-03 -1.0817647e-03]
10949290146151676233.wav 273280
[0.0000000e+00 0.0000000e+00 0.0000000e+00 ... 1.4293194e-04 5.1200390e-05
 1.0114908e-04]
8277463471762550023.wav 251520
[0.         0.         0.         ... 0.00026637 0.00031906 0.0003075 ]
1351715574318686401.wav 283200
[ 0.0000000e+00  0.0000000e+00  0.0000000e+00 ... -2.4855137e-05
 -2.2649765e-05 -2.2768974e-05]
16122645321793286284.wav 276480
[0.         0.         0.         ... 0.00013369 0.00012755 0.00010586]
6268497158786378126.wav 205440
[ 0.0000000e+00  0.0000000e+00  0.0000000e+00 ... -9.4234943e-05
 -9.3817711e-05 -6.1929226e-05]
18406252259550691536.wav 139200
[ 0.0000000e+00  0.0000000e+00  0.0000000e+00 ... -5.2332878e-05
 -4.2319298e-06  3.3318996e-05]
for i in range(10):
  file, raw_data = random.choice(list(small_dataset.all_audio.items()))
  print(file, len(raw_data))
  display(Audio(raw_data, rate=fs, autoplay=False))
18059580157250761435.wav 344640
7669819575583671099.wav 189120
10824731430851864186.wav 196800
14192991371425576281.wav 133440
12601036378860326355.wav 222400
16298512420216472244.wav 275520
5217965021762558271.wav 170880
6006946498162292333.wav 247360
11031078104467854733.wav 130560
10777625043982141593.wav 281280
from IPython.display import Audio
fs = 16100
display(Audio(raw_data, rate=fs, autoplay=True))
type(small_dataset.labels), small_dataset.labels[0]
small_dataset.labels
[{'id': 1779,
  'file_name': '10325559490685159122.wav',
  'raw_transcription': '特朗普与土耳其总统雷杰普·塔伊普·埃尔多安(Recep Tayyip Erdoğan)通话后发表了声明。',
  'transcription': '特朗普与土耳其总统雷杰普·塔伊普·埃尔多安recep tayyip erdoğan通话后发表了声明',
  '_': '特 朗 普 与 土 耳 其 总 统 雷 杰 普 · 塔 伊 普 · 埃 尔 多 安 r e c e p | t a y y i p | e r d o ğ a n 通 话 后 发 表 了 声 明 |',
  'num_samples': 242560,
  'gender': 'MALE'},
 {'id': 1779,
  'file_name': '149040922025982373.wav',
  'raw_transcription': '特朗普与土耳其总统雷杰普·塔伊普·埃尔多安(Recep Tayyip Erdoğan)通话后发表了声明。',
  'transcription': '特朗普与土耳其总统雷杰普·塔伊普·埃尔多安recep tayyip erdoğan通话后发表了声明',
  '_': '特 朗 普 与 土 耳 其 总 统 雷 杰 普 · 塔 伊 普 · 埃 尔 多 安 r e c e p | t a y y i p | e r d o ğ a n 通 话 后 发 表 了 声 明 |',
  'num_samples': 127680,
  'gender': 'FEMALE'},
 {'id': 1843,
  'file_name': '14716260585206763911.wav',
  'raw_transcription': '邓迪大学(University of Dundee)的 Pamela Ferguson 教授指出:“记者如果公布嫌疑人的照片等信息的话,似乎确实存在危害性。”',
  'transcription': '邓 迪 大 学 university of dundee 的 pamela ferguson 教 授 指 出 记 者 如 果 公 布 嫌 疑 人 的 照 片 等 信 息 的 话 似 乎 确 实 存 在 危 害 性',
  '_': '邓 | 迪 | 大 | 学 | u n i v e r s i t y | o f | d u n d e e | 的 | p a m e l a | f e r g u s o n | 教 | 授 | 指 | 出 | 记 | 者 | 如 | 果 | 公 | 布 | 嫌 | 疑 | 人 | 的 | 照 | 片 | 等 | 信 | 息 | 的 | 话 | 似 | 乎 | 确 | 实 | 存 | 在 | 危 | 害 | 性 |',
  'num_samples': 138240,
  'gender': 'FEMALE'},
 {'id': 1843,
  'file_name': '18085818397836204673.wav',
  'raw_transcription': '邓迪大学(University of Dundee)的 Pamela Ferguson 教授指出:“记者如果公布嫌疑人的照片等信息的话,似乎确实存在危害性。”',
  'transcription': '邓 迪 大 学 university of dundee 的 pamela ferguson 教 授 指 出 记 者 如 果 公 布 嫌 疑 人 的 照 片 等 信 息 的 话 似 乎 确 实 存 在 危 害 性',
  '_': '邓 | 迪 | 大 | 学 | u n i v e r s i t y | o f | d u n d e e | 的 | p a m e l a | f e r g u s o n | 教 | 授 | 指 | 出 | 记 | 者 | 如 | 果 | 公 | 布 | 嫌 | 疑 | 人 | 的 | 照 | 片 | 等 | 信 | 息 | 的 | 话 | 似 | 乎 | 确 | 实 | 存 | 在 | 危 | 害 | 性 |',
  'num_samples': 241280,
  'gender': 'MALE'},
 {'id': 1843,
  'file_name': '314154669869510753.wav',
  'raw_transcription': '邓迪大学(University of Dundee)的 Pamela Ferguson 教授指出:“记者如果公布嫌疑人的照片等信息的话,似乎确实存在危害性。”',
  'transcription': '邓 迪 大 学 university of dundee 的 pamela ferguson 教 授 指 出 记 者 如 果 公 布 嫌 疑 人 的 照 片 等 信 息 的 话 似 乎 确 实 存 在 危 害 性',
  '_': '邓 | 迪 | 大 | 学 | u n i v e r s i t y | o f | d u n d e e | 的 | p a m e l a | f e r g u s o n | 教 | 授 | 指 | 出 | 记 | 者 | 如 | 果 | 公 | 布 | 嫌 | 疑 | 人 | 的 | 照 | 片 | 等 | 信 | 息 | 的 | 话 | 似 | 乎 | 确 | 实 | 存 | 在 | 危 | 害 | 性 |',
  'num_samples': 171840,
  'gender': 'FEMALE'},
 {'id': 1780,
  'file_name': '10369927130798325266.wav',
  'raw_transcription': '在昆达里尼瑜伽中,昆达里尼能量(启迪能量)通过瑜伽姿势、呼吸练习、念语和视觉形象被唤醒。',
  'transcription': '在 昆 达 里 尼 瑜 伽 中 昆 达 里 尼 能 量 启 迪 能 量 通 过 瑜 伽 姿 势 呼 吸 练 习 念 语 和 视 觉 形 象 被 唤 醒',
  '_': '在 | 昆 | 达 | 里 | 尼 | 瑜 | 伽 | 中 | 昆 | 达 | 里 | 尼 | 能 | 量 | 启 | 迪 | 能 | 量 | 通 | 过 | 瑜 | 伽 | 姿 | 势 | 呼 | 吸 | 练 | 习 | 念 | 语 | 和 | 视 | 觉 | 形 | 象 | 被 | 唤 | 醒 |',
  'num_samples': 250880,
  'gender': 'MALE'},
 {'id': 1780,
  'file_name': '13272278541372870938.wav',
  'raw_transcription': '在昆达里尼瑜伽中,昆达里尼能量(启迪能量)通过瑜伽姿势、呼吸练习、念语和视觉形象被唤醒。',
  'transcription': '在 昆 达 里 尼 瑜 伽 中 昆 达 里 尼 能 量 启 迪 能 量 通 过 瑜 伽 姿 势 呼 吸 练 习 念 语 和 视 觉 形 象 被 唤 醒',
  '_': '在 | 昆 | 达 | 里 | 尼 | 瑜 | 伽 | 中 | 昆 | 达 | 里 | 尼 | 能 | 量 | 启 | 迪 | 能 | 量 | 通 | 过 | 瑜 | 伽 | 姿 | 势 | 呼 | 吸 | 练 | 习 | 念 | 语 | 和 | 视 | 觉 | 形 | 象 | 被 | 唤 | 醒 |',
  'num_samples': 182400,
  'gender': 'FEMALE'},
 {'id': 1780,
  'file_name': '9584200288013257239.wav',
  'raw_transcription': '在昆达里尼瑜伽中,昆达里尼能量(启迪能量)通过瑜伽姿势、呼吸练习、念语和视觉形象被唤醒。',
  'transcription': '在 昆 达 里 尼 瑜 伽 中 昆 达 里 尼 能 量 启 迪 能 量 通 过 瑜 伽 姿 势 呼 吸 练 习 念 语 和 视 觉 形 象 被 唤 醒',
  '_': '在 | 昆 | 达 | 里 | 尼 | 瑜 | 伽 | 中 | 昆 | 达 | 里 | 尼 | 能 | 量 | 启 | 迪 | 能 | 量 | 通 | 过 | 瑜 | 伽 | 姿 | 势 | 呼 | 吸 | 练 | 习 | 念 | 语 | 和 | 视 | 觉 | 形 | 象 | 被 | 唤 | 醒 |',
  'num_samples': 190080,
  'gender': 'MALE'},
 {'id': 1847,
  'file_name': '7669819575583671099.wav',
  'raw_transcription': '他受到了新加坡副总理黄根成的欢迎,并与新加坡总理李显龙探讨了贸易和恐怖主义问题。',
  'transcription': '他 受 到 了 新 加 坡 副 总 理 黄 根 成 的 欢 迎 并 与 新 加 坡 总 理 李 显 龙 探 讨 了 贸 易 和 恐 怖 主 义 问 题',
  '_': '他 | 受 | 到 | 了 | 新 | 加 | 坡 | 副 | 总 | 理 | 黄 | 根 | 成 | 的 | 欢 | 迎 | 并 | 与 | 新 | 加 | 坡 | 总 | 理 | 李 | 显 | 龙 | 探 | 讨 | 了 | 贸 | 易 | 和 | 恐 | 怖 | 主 | 义 | 问 | 题 |',
  'num_samples': 189120,
  'gender': 'MALE'},
 {'id': 1847,
  'file_name': '16984178234391746055.wav',
  'raw_transcription': '他受到了新加坡副总理黄根成的欢迎,并与新加坡总理李显龙探讨了贸易和恐怖主义问题。',
  'transcription': '他 受 到 了 新 加 坡 副 总 理 黄 根 成 的 欢 迎 并 与 新 加 坡 总 理 李 显 龙 探 讨 了 贸 易 和 恐 怖 主 义 问 题',
  '_': '他 | 受 | 到 | 了 | 新 | 加 | 坡 | 副 | 总 | 理 | 黄 | 根 | 成 | 的 | 欢 | 迎 | 并 | 与 | 新 | 加 | 坡 | 总 | 理 | 李 | 显 | 龙 | 探 | 讨 | 了 | 贸 | 易 | 和 | 恐 | 怖 | 主 | 义 | 问 | 题 |',
  'num_samples': 129600,
  'gender': 'FEMALE'},
 {'id': 1847,
  'file_name': '12920606526708767779.wav',
  'raw_transcription': '他受到了新加坡副总理黄根成的欢迎,并与新加坡总理李显龙探讨了贸易和恐怖主义问题。',
  'transcription': '他 受 到 了 新 加 坡 副 总 理 黄 根 成 的 欢 迎 并 与 新 加 坡 总 理 李 显 龙 探 讨 了 贸 易 和 恐 怖 主 义 问 题',
  '_': '他 | 受 | 到 | 了 | 新 | 加 | 坡 | 副 | 总 | 理 | 黄 | 根 | 成 | 的 | 欢 | 迎 | 并 | 与 | 新 | 加 | 坡 | 总 | 理 | 李 | 显 | 龙 | 探 | 讨 | 了 | 贸 | 易 | 和 | 恐 | 怖 | 主 | 义 | 问 | 题 |',
  'num_samples': 200320,
  'gender': 'MALE'},
 {'id': 1922,
  'file_name': '17791005930196814474.wav',
  'raw_transcription': '当然,这个传统有其基督教神学的解释,但它很可能是基督诞生以前就存在的一种庆祝春天、祈求丰收的仪式。',
  'transcription': '当 然 这 个 传 统 有 其 基 督 教 神 学 的 解 释 但 它 很 可 能 是 基 督 诞 生 以 前 就 存 在 的 一 种 庆 祝 春 天 祈 求 丰 收 的 仪 式',
  '_': '当 | 然 | 这 | 个 | 传 | 统 | 有 | 其 | 基 | 督 | 教 | 神 | 学 | 的 | 解 | 释 | 但 | 它 | 很 | 可 | 能 | 是 | 基 | 督 | 诞 | 生 | 以 | 前 | 就 | 存 | 在 | 的 | 一 | 种 | 庆 | 祝 | 春 | 天 | 祈 | 求 | 丰 | 收 | 的 | 仪 | 式 |',
  'num_samples': 226560,
  'gender': 'MALE'},
 {'id': 1922,
  'file_name': '9543874871524874019.wav',
  'raw_transcription': '当然,这个传统有其基督教神学的解释,但它很可能是基督诞生以前就存在的一种庆祝春天、祈求丰收的仪式。',
  'transcription': '当 然 这 个 传 统 有 其 基 督 教 神 学 的 解 释 但 它 很 可 能 是 基 督 诞 生 以 前 就 存 在 的 一 种 庆 祝 春 天 祈 求 丰 收 的 仪 式',
  '_': '当 | 然 | 这 | 个 | 传 | 统 | 有 | 其 | 基 | 督 | 教 | 神 | 学 | 的 | 解 | 释 | 但 | 它 | 很 | 可 | 能 | 是 | 基 | 督 | 诞 | 生 | 以 | 前 | 就 | 存 | 在 | 的 | 一 | 种 | 庆 | 祝 | 春 | 天 | 祈 | 求 | 丰 | 收 | 的 | 仪 | 式 |',
  'num_samples': 267200,
  'gender': 'MALE'},
 {'id': 1687,
  'file_name': '6567034835218108721.wav',
  'raw_transcription': '由于分离和重组,变异在每一代的两个库之间来回变动。',
  'transcription': '由 于 分 离 和 重 组 变 异 在 每 一 代 的 两 个 库 之 间 来 回 变 动',
  '_': '由 | 于 | 分 | 离 | 和 | 重 | 组 | 变 | 异 | 在 | 每 | 一 | 代 | 的 | 两 | 个 | 库 | 之 | 间 | 来 | 回 | 变 | 动 |',
  'num_samples': 131520,
  'gender': 'MALE'},
 {'id': 1687,
  'file_name': '13317583624503091010.wav',
  'raw_transcription': '由于分离和重组,变异在每一代的两个库之间来回变动。',
  'transcription': '由 于 分 离 和 重 组 变 异 在 每 一 代 的 两 个 库 之 间 来 回 变 动',
  '_': '由 | 于 | 分 | 离 | 和 | 重 | 组 | 变 | 异 | 在 | 每 | 一 | 代 | 的 | 两 | 个 | 库 | 之 | 间 | 来 | 回 | 变 | 动 |',
  'num_samples': 125440,
  'gender': 'MALE'},
 {'id': 1687,
  'file_name': '12933878060487367144.wav',
  'raw_transcription': '由于分离和重组,变异在每一代的两个库之间来回变动。',
  'transcription': '由 于 分 离 和 重 组 变 异 在 每 一 代 的 两 个 库 之 间 来 回 变 动',
  '_': '由 | 于 | 分 | 离 | 和 | 重 | 组 | 变 | 异 | 在 | 每 | 一 | 代 | 的 | 两 | 个 | 库 | 之 | 间 | 来 | 回 | 变 | 动 |',
  'num_samples': 106560,
  'gender': 'MALE'},
 {'id': 1711,
  'file_name': '4048226328336996391.wav',
  'raw_transcription': '这些理论研究为什么某些人想要做他们所做的事情,以及他们所处的环境中哪些事情会让他们做或不做某些事情。',
  'transcription': '这 些 理 论 研 究 为 什 么 某 些 人 想 要 做 他 们 所 做 的 事 情 以 及 他 们 所 处 的 环 境 中 哪 些 事 情 会 让 他 们 做 或 不 做 某 些 事 情',
  '_': '这 | 些 | 理 | 论 | 研 | 究 | 为 | 什 | 么 | 某 | 些 | 人 | 想 | 要 | 做 | 他 | 们 | 所 | 做 | 的 | 事 | 情 | 以 | 及 | 他 | 们 | 所 | 处 | 的 | 环 | 境 | 中 | 哪 | 些 | 事 | 情 | 会 | 让 | 他 | 们 | 做 | 或 | 不 | 做 | 某 | 些 | 事 | 情 |',
  'num_samples': 273280,
  'gender': 'MALE'},
 {'id': 1711,
  'file_name': '11332085919094392943.wav',
  'raw_transcription': '这些理论研究为什么某些人想要做他们所做的事情,以及他们所处的环境中哪些事情会让他们做或不做某些事情。',
  'transcription': '这 些 理 论 研 究 为 什 么 某 些 人 想 要 做 他 们 所 做 的 事 情 以 及 他 们 所 处 的 环 境 中 哪 些 事 情 会 让 他 们 做 或 不 做 某 些 事 情',
  '_': '这 | 些 | 理 | 论 | 研 | 究 | 为 | 什 | 么 | 某 | 些 | 人 | 想 | 要 | 做 | 他 | 们 | 所 | 做 | 的 | 事 | 情 | 以 | 及 | 他 | 们 | 所 | 处 | 的 | 环 | 境 | 中 | 哪 | 些 | 事 | 情 | 会 | 让 | 他 | 们 | 做 | 或 | 不 | 做 | 某 | 些 | 事 | 情 |',
  'num_samples': 187200,
  'gender': 'MALE'},
 {'id': 1711,
  'file_name': '12460789112089593115.wav',
  'raw_transcription': '这些理论研究为什么某些人想要做他们所做的事情,以及他们所处的环境中哪些事情会让他们做或不做某些事情。',
  'transcription': '这 些 理 论 研 究 为 什 么 某 些 人 想 要 做 他 们 所 做 的 事 情 以 及 他 们 所 处 的 环 境 中 哪 些 事 情 会 让 他 们 做 或 不 做 某 些 事 情',
  '_': '这 | 些 | 理 | 论 | 研 | 究 | 为 | 什 | 么 | 某 | 些 | 人 | 想 | 要 | 做 | 他 | 们 | 所 | 做 | 的 | 事 | 情 | 以 | 及 | 他 | 们 | 所 | 处 | 的 | 环 | 境 | 中 | 哪 | 些 | 事 | 情 | 会 | 让 | 他 | 们 | 做 | 或 | 不 | 做 | 某 | 些 | 事 | 情 |',
  'num_samples': 157440,
  'gender': 'FEMALE'},
 {'id': 1812,
  'file_name': '16272218284004703131.wav',
  'raw_transcription': '虽然有一种实验性疫苗看似能够降低埃博拉病毒的死亡率,但迄今为止,还没明确证明任何药物适合治疗现有的感染。',
  'transcription': '虽 然 有 一 种 实 验 性 疫 苗 看 似 能 够 降 低 埃 博 拉 病 毒 的 死 亡 率 但 迄 今 为 止 还 没 明 确 证 明 任 何 药 物 适 合 治 疗 现 有 的 感 染',
  '_': '虽 | 然 | 有 | 一 | 种 | 实 | 验 | 性 | 疫 | 苗 | 看 | 似 | 能 | 够 | 降 | 低 | 埃 | 博 | 拉 | 病 | 毒 | 的 | 死 | 亡 | 率 | 但 | 迄 | 今 | 为 | 止 | 还 | 没 | 明 | 确 | 证 | 明 | 任 | 何 | 药 | 物 | 适 | 合 | 治 | 疗 | 现 | 有 | 的 | 感 | 染 |',
  'num_samples': 173760,
  'gender': 'FEMALE'},
 {'id': 1812,
  'file_name': '1250603439964009503.wav',
  'raw_transcription': '虽然有一种实验性疫苗看似能够降低埃博拉病毒的死亡率,但迄今为止,还没明确证明任何药物适合治疗现有的感染。',
  'transcription': '虽 然 有 一 种 实 验 性 疫 苗 看 似 能 够 降 低 埃 博 拉 病 毒 的 死 亡 率 但 迄 今 为 止 还 没 明 确 证 明 任 何 药 物 适 合 治 疗 现 有 的 感 染',
  '_': '虽 | 然 | 有 | 一 | 种 | 实 | 验 | 性 | 疫 | 苗 | 看 | 似 | 能 | 够 | 降 | 低 | 埃 | 博 | 拉 | 病 | 毒 | 的 | 死 | 亡 | 率 | 但 | 迄 | 今 | 为 | 止 | 还 | 没 | 明 | 确 | 证 | 明 | 任 | 何 | 药 | 物 | 适 | 合 | 治 | 疗 | 现 | 有 | 的 | 感 | 染 |',
  'num_samples': 180480,
  'gender': 'MALE'},
 {'id': 1869,
  'file_name': '10104380129516909856.wav',
  'raw_transcription': '它的长下颚上布满了 70 多颗剃刀般锋利的牙齿,上颚上还有一排。这意味着任何与它相遇的东西都无路可逃。',
  'transcription': '它 的 长 下 颚 上 布 满 了 70 多 颗 剃 刀 般 锋 利 的 牙 齿 上 颚 上 还 有 一 排 这 意 味 着 任 何 与 它 相 遇 的 东 西 都 无 路 可 逃',
  '_': '它 | 的 | 长 | 下 | 颚 | 上 | 布 | 满 | 了 | 7 0 | 多 | 颗 | 剃 | 刀 | 般 | 锋 | 利 | 的 | 牙 | 齿 | 上 | 颚 | 上 | 还 | 有 | 一 | 排 | 这 | 意 | 味 | 着 | 任 | 何 | 与 | 它 | 相 | 遇 | 的 | 东 | 西 | 都 | 无 | 路 | 可 | 逃 |',
  'num_samples': 247360,
  'gender': 'MALE'},
 {'id': 1869,
  'file_name': '3479937853441610528.wav',
  'raw_transcription': '它的长下颚上布满了 70 多颗剃刀般锋利的牙齿,上颚上还有一排。这意味着任何与它相遇的东西都无路可逃。',
  'transcription': '它 的 长 下 颚 上 布 满 了 70 多 颗 剃 刀 般 锋 利 的 牙 齿 上 颚 上 还 有 一 排 这 意 味 着 任 何 与 它 相 遇 的 东 西 都 无 路 可 逃',
  '_': '它 | 的 | 长 | 下 | 颚 | 上 | 布 | 满 | 了 | 7 0 | 多 | 颗 | 剃 | 刀 | 般 | 锋 | 利 | 的 | 牙 | 齿 | 上 | 颚 | 上 | 还 | 有 | 一 | 排 | 这 | 意 | 味 | 着 | 任 | 何 | 与 | 它 | 相 | 遇 | 的 | 东 | 西 | 都 | 无 | 路 | 可 | 逃 |',
  'num_samples': 328000,
  'gender': 'MALE'},
 {'id': 1686,
  'file_name': '10852536777113131618.wav',
  'raw_transcription': '因此,一个组织在共同努力克服障碍的过程中,往往会带来新的创新流程,以满足客户的需求。',
  'transcription': '因 此 一 个 组 织 在 共 同 努 力 克 服 障 碍 的 过 程 中 往 往 会 带 来 新 的 创 新 流 程 以 满 足 客 户 的 需 求',
  '_': '因 | 此 | 一 | 个 | 组 | 织 | 在 | 共 | 同 | 努 | 力 | 克 | 服 | 障 | 碍 | 的 | 过 | 程 | 中 | 往 | 往 | 会 | 带 | 来 | 新 | 的 | 创 | 新 | 流 | 程 | 以 | 满 | 足 | 客 | 户 | 的 | 需 | 求 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1686,
  'file_name': '16705376166490597497.wav',
  'raw_transcription': '因此,一个组织在共同努力克服障碍的过程中,往往会带来新的创新流程,以满足客户的需求。',
  'transcription': '因 此 一 个 组 织 在 共 同 努 力 克 服 障 碍 的 过 程 中 往 往 会 带 来 新 的 创 新 流 程 以 满 足 客 户 的 需 求',
  '_': '因 | 此 | 一 | 个 | 组 | 织 | 在 | 共 | 同 | 努 | 力 | 克 | 服 | 障 | 碍 | 的 | 过 | 程 | 中 | 往 | 往 | 会 | 带 | 来 | 新 | 的 | 创 | 新 | 流 | 程 | 以 | 满 | 足 | 客 | 户 | 的 | 需 | 求 |',
  'num_samples': 181440,
  'gender': 'MALE'},
 {'id': 1661,
  'file_name': '1868048601472473390.wav',
  'raw_transcription': '他没有设定削减数额,只是表示将根据中国的经济产出来决定数额。',
  'transcription': '他 没 有 设 定 削 减 数 额 只 是 表 示 将 根 据 中 国 的 经 济 产 出 来 决 定 数 额',
  '_': '他 | 没 | 有 | 设 | 定 | 削 | 减 | 数 | 额 | 只 | 是 | 表 | 示 | 将 | 根 | 据 | 中 | 国 | 的 | 经 | 济 | 产 | 出 | 来 | 决 | 定 | 数 | 额 |',
  'num_samples': 207360,
  'gender': 'MALE'},
 {'id': 1661,
  'file_name': '1061358881165519725.wav',
  'raw_transcription': '他没有设定削减数额,只是表示将根据中国的经济产出来决定数额。',
  'transcription': '他 没 有 设 定 削 减 数 额 只 是 表 示 将 根 据 中 国 的 经 济 产 出 来 决 定 数 额',
  '_': '他 | 没 | 有 | 设 | 定 | 削 | 减 | 数 | 额 | 只 | 是 | 表 | 示 | 将 | 根 | 据 | 中 | 国 | 的 | 经 | 济 | 产 | 出 | 来 | 决 | 定 | 数 | 额 |',
  'num_samples': 123840,
  'gender': 'MALE'},
 {'id': 1661,
  'file_name': '3834960506613691209.wav',
  'raw_transcription': '他没有设定削减数额,只是表示将根据中国的经济产出来决定数额。',
  'transcription': '他 没 有 设 定 削 减 数 额 只 是 表 示 将 根 据 中 国 的 经 济 产 出 来 决 定 数 额',
  '_': '他 | 没 | 有 | 设 | 定 | 削 | 减 | 数 | 额 | 只 | 是 | 表 | 示 | 将 | 根 | 据 | 中 | 国 | 的 | 经 | 济 | 产 | 出 | 来 | 决 | 定 | 数 | 额 |',
  'num_samples': 157440,
  'gender': 'MALE'},
 {'id': 1870,
  'file_name': '8424295226444731846.wav',
  'raw_transcription': '场景在金字塔上展示,不同的金字塔被点亮。',
  'transcription': '场 景 在 金 字 塔 上 展 示 不 同 的 金 字 塔 被 点 亮',
  '_': '场 | 景 | 在 | 金 | 字 | 塔 | 上 | 展 | 示 | 不 | 同 | 的 | 金 | 字 | 塔 | 被 | 点 | 亮 |',
  'num_samples': 160640,
  'gender': 'MALE'},
 {'id': 1870,
  'file_name': '2457828970653407656.wav',
  'raw_transcription': '场景在金字塔上展示,不同的金字塔被点亮。',
  'transcription': '场 景 在 金 字 塔 上 展 示 不 同 的 金 字 塔 被 点 亮',
  '_': '场 | 景 | 在 | 金 | 字 | 塔 | 上 | 展 | 示 | 不 | 同 | 的 | 金 | 字 | 塔 | 被 | 点 | 亮 |',
  'num_samples': 77760,
  'gender': 'FEMALE'},
 {'id': 1870,
  'file_name': '5515271720540825332.wav',
  'raw_transcription': '场景在金字塔上展示,不同的金字塔被点亮。',
  'transcription': '场 景 在 金 字 塔 上 展 示 不 同 的 金 字 塔 被 点 亮',
  '_': '场 | 景 | 在 | 金 | 字 | 塔 | 上 | 展 | 示 | 不 | 同 | 的 | 金 | 字 | 塔 | 被 | 点 | 亮 |',
  'num_samples': 95040,
  'gender': 'MALE'},
 {'id': 1725,
  'file_name': '15324743446256875074.wav',
  'raw_transcription': '早先于全球发布的华硕 Eee PC 个人笔记本,因成本节约及功能性因素,成为 2007 年台北 IT 资讯月备受瞩目的话题。',
  'transcription': '早 先 于 全 球 发 布 的 华 硕 eee pc 个 人 笔 记 本 因 成 本 节 约 及 功 能 性 因 素 成 为 2007 年 台 北 it 资 讯 月 备 受 瞩 目 的 话 题',
  '_': '早 | 先 | 于 | 全 | 球 | 发 | 布 | 的 | 华 | 硕 | e e e | p c | 个 | 人 | 笔 | 记 | 本 | 因 | 成 | 本 | 节 | 约 | 及 | 功 | 能 | 性 | 因 | 素 | 成 | 为 | 2 0 0 7 | 年 | 台 | 北 | i t | 资 | 讯 | 月 | 备 | 受 | 瞩 | 目 | 的 | 话 | 题 |',
  'num_samples': 248640,
  'gender': 'MALE'},
 {'id': 1725,
  'file_name': '10558410879827163654.wav',
  'raw_transcription': '早先于全球发布的华硕 Eee PC 个人笔记本,因成本节约及功能性因素,成为 2007 年台北 IT 资讯月备受瞩目的话题。',
  'transcription': '早 先 于 全 球 发 布 的 华 硕 eee pc 个 人 笔 记 本 因 成 本 节 约 及 功 能 性 因 素 成 为 2007 年 台 北 it 资 讯 月 备 受 瞩 目 的 话 题',
  '_': '早 | 先 | 于 | 全 | 球 | 发 | 布 | 的 | 华 | 硕 | e e e | p c | 个 | 人 | 笔 | 记 | 本 | 因 | 成 | 本 | 节 | 约 | 及 | 功 | 能 | 性 | 因 | 素 | 成 | 为 | 2 0 0 7 | 年 | 台 | 北 | i t | 资 | 讯 | 月 | 备 | 受 | 瞩 | 目 | 的 | 话 | 题 |',
  'num_samples': 193920,
  'gender': 'MALE'},
 {'id': 1725,
  'file_name': '17936905303617758253.wav',
  'raw_transcription': '早先于全球发布的华硕 Eee PC 个人笔记本,因成本节约及功能性因素,成为 2007 年台北 IT 资讯月备受瞩目的话题。',
  'transcription': '早 先 于 全 球 发 布 的 华 硕 eee pc 个 人 笔 记 本 因 成 本 节 约 及 功 能 性 因 素 成 为 2007 年 台 北 it 资 讯 月 备 受 瞩 目 的 话 题',
  '_': '早 | 先 | 于 | 全 | 球 | 发 | 布 | 的 | 华 | 硕 | e e e | p c | 个 | 人 | 笔 | 记 | 本 | 因 | 成 | 本 | 节 | 约 | 及 | 功 | 能 | 性 | 因 | 素 | 成 | 为 | 2 0 0 7 | 年 | 台 | 北 | i t | 资 | 讯 | 月 | 备 | 受 | 瞩 | 目 | 的 | 话 | 题 |',
  'num_samples': 209280,
  'gender': 'FEMALE'},
 {'id': 1894,
  'file_name': '8702090716396029445.wav',
  'raw_transcription': '咖喱饭菜是一道以香草和香料为主的菜肴,并配以肉类或蔬菜。',
  'transcription': '咖 喱 饭 菜 是 一 道 以 香 草 和 香 料 为 主 的 菜 肴 并 配 以 肉 类 或 蔬 菜',
  '_': '咖 | 喱 | 饭 | 菜 | 是 | 一 | 道 | 以 | 香 | 草 | 和 | 香 | 料 | 为 | 主 | 的 | 菜 | 肴 | 并 | 配 | 以 | 肉 | 类 | 或 | 蔬 | 菜 |',
  'num_samples': 192960,
  'gender': 'MALE'},
 {'id': 1894,
  'file_name': '14171001004525376046.wav',
  'raw_transcription': '咖喱饭菜是一道以香草和香料为主的菜肴,并配以肉类或蔬菜。',
  'transcription': '咖 喱 饭 菜 是 一 道 以 香 草 和 香 料 为 主 的 菜 肴 并 配 以 肉 类 或 蔬 菜',
  '_': '咖 | 喱 | 饭 | 菜 | 是 | 一 | 道 | 以 | 香 | 草 | 和 | 香 | 料 | 为 | 主 | 的 | 菜 | 肴 | 并 | 配 | 以 | 肉 | 类 | 或 | 蔬 | 菜 |',
  'num_samples': 92160,
  'gender': 'FEMALE'},
 {'id': 1894,
  'file_name': '14943022663521593704.wav',
  'raw_transcription': '咖喱饭菜是一道以香草和香料为主的菜肴,并配以肉类或蔬菜。',
  'transcription': '咖 喱 饭 菜 是 一 道 以 香 草 和 香 料 为 主 的 菜 肴 并 配 以 肉 类 或 蔬 菜',
  '_': '咖 | 喱 | 饭 | 菜 | 是 | 一 | 道 | 以 | 香 | 草 | 和 | 香 | 料 | 为 | 主 | 的 | 菜 | 肴 | 并 | 配 | 以 | 肉 | 类 | 或 | 蔬 | 菜 |',
  'num_samples': 196160,
  'gender': 'MALE'},
 {'id': 1799,
  'file_name': '1177351021583652757.wav',
  'raw_transcription': '除了周三的比赛,卡帕内多(Carpanedo)还参加了锦标赛的两项个人竞赛。',
  'transcription': '除 了 周 三 的 比 赛 卡 帕 内 多 carpanedo 还 参 加 了 锦 标 赛 的 两 项 个 人 竞 赛',
  '_': '除 | 了 | 周 | 三 | 的 | 比 | 赛 | 卡 | 帕 | 内 | 多 | c a r p a n e d o | 还 | 参 | 加 | 了 | 锦 | 标 | 赛 | 的 | 两 | 项 | 个 | 人 | 竞 | 赛 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 1799,
  'file_name': '14451470179733782867.wav',
  'raw_transcription': '除了周三的比赛,卡帕内多(Carpanedo)还参加了锦标赛的两项个人竞赛。',
  'transcription': '除 了 周 三 的 比 赛 卡 帕 内 多 carpanedo 还 参 加 了 锦 标 赛 的 两 项 个 人 竞 赛',
  '_': '除 | 了 | 周 | 三 | 的 | 比 | 赛 | 卡 | 帕 | 内 | 多 | c a r p a n e d o | 还 | 参 | 加 | 了 | 锦 | 标 | 赛 | 的 | 两 | 项 | 个 | 人 | 竞 | 赛 |',
  'num_samples': 122880,
  'gender': 'MALE'},
 {'id': 1799,
  'file_name': '3983686671420019505.wav',
  'raw_transcription': '除了周三的比赛,卡帕内多(Carpanedo)还参加了锦标赛的两项个人竞赛。',
  'transcription': '除 了 周 三 的 比 赛 卡 帕 内 多 carpanedo 还 参 加 了 锦 标 赛 的 两 项 个 人 竞 赛',
  '_': '除 | 了 | 周 | 三 | 的 | 比 | 赛 | 卡 | 帕 | 内 | 多 | c a r p a n e d o | 还 | 参 | 加 | 了 | 锦 | 标 | 赛 | 的 | 两 | 项 | 个 | 人 | 竞 | 赛 |',
  'num_samples': 224000,
  'gender': 'MALE'},
 {'id': 1911,
  'file_name': '16106752411261640702.wav',
  'raw_transcription': '同理,有了申根签证,你就不必分别向每个申根成员国申请签证,从而节省了时间、金钱和手续。',
  'transcription': '同 理 有 了 申 根 签 证 你 就 不 必 分 别 向 每 个 申 根 成 员 国 申 请 签 证 从 而 节 省 了 时 间 金 钱 和 手 续',
  '_': '同 | 理 | 有 | 了 | 申 | 根 | 签 | 证 | 你 | 就 | 不 | 必 | 分 | 别 | 向 | 每 | 个 | 申 | 根 | 成 | 员 | 国 | 申 | 请 | 签 | 证 | 从 | 而 | 节 | 省 | 了 | 时 | 间 | 金 | 钱 | 和 | 手 | 续 |',
  'num_samples': 191040,
  'gender': 'MALE'},
 {'id': 1911,
  'file_name': '6127233701639079068.wav',
  'raw_transcription': '同理,有了申根签证,你就不必分别向每个申根成员国申请签证,从而节省了时间、金钱和手续。',
  'transcription': '同 理 有 了 申 根 签 证 你 就 不 必 分 别 向 每 个 申 根 成 员 国 申 请 签 证 从 而 节 省 了 时 间 金 钱 和 手 续',
  '_': '同 | 理 | 有 | 了 | 申 | 根 | 签 | 证 | 你 | 就 | 不 | 必 | 分 | 别 | 向 | 每 | 个 | 申 | 根 | 成 | 员 | 国 | 申 | 请 | 签 | 证 | 从 | 而 | 节 | 省 | 了 | 时 | 间 | 金 | 钱 | 和 | 手 | 续 |',
  'num_samples': 170880,
  'gender': 'MALE'},
 {'id': 1911,
  'file_name': '12546458689759218123.wav',
  'raw_transcription': '同理,有了申根签证,你就不必分别向每个申根成员国申请签证,从而节省了时间、金钱和手续。',
  'transcription': '同 理 有 了 申 根 签 证 你 就 不 必 分 别 向 每 个 申 根 成 员 国 申 请 签 证 从 而 节 省 了 时 间 金 钱 和 手 续',
  '_': '同 | 理 | 有 | 了 | 申 | 根 | 签 | 证 | 你 | 就 | 不 | 必 | 分 | 别 | 向 | 每 | 个 | 申 | 根 | 成 | 员 | 国 | 申 | 请 | 签 | 证 | 从 | 而 | 节 | 省 | 了 | 时 | 间 | 金 | 钱 | 和 | 手 | 续 |',
  'num_samples': 157440,
  'gender': 'MALE'},
 {'id': 1699,
  'file_name': '2515301159673924045.wav',
  'raw_transcription': '一名观察者形容比什凯克(Bishkek)正在陷入“无政府“ 状态,成群的人们在街上游荡,掠夺商店里的消费品。',
  'transcription': '一 名 观 察 者 形 容 比 什 凯 克 bishkek 正 在 陷 入 无 政 府 状 态 成 群 的 人 们 在 街 上 游 荡 掠 夺 商 店 里 的 消 费 品',
  '_': '一 | 名 | 观 | 察 | 者 | 形 | 容 | 比 | 什 | 凯 | 克 | b i s h k e k | 正 | 在 | 陷 | 入 | 无 | 政 | 府 | 状 | 态 | 成 | 群 | 的 | 人 | 们 | 在 | 街 | 上 | 游 | 荡 | 掠 | 夺 | 商 | 店 | 里 | 的 | 消 | 费 | 品 |',
  'num_samples': 259200,
  'gender': 'MALE'},
 {'id': 1699,
  'file_name': '4204146767749843316.wav',
  'raw_transcription': '一名观察者形容比什凯克(Bishkek)正在陷入“无政府“ 状态,成群的人们在街上游荡,掠夺商店里的消费品。',
  'transcription': '一 名 观 察 者 形 容 比 什 凯 克 bishkek 正 在 陷 入 无 政 府 状 态 成 群 的 人 们 在 街 上 游 荡 掠 夺 商 店 里 的 消 费 品',
  '_': '一 | 名 | 观 | 察 | 者 | 形 | 容 | 比 | 什 | 凯 | 克 | b i s h k e k | 正 | 在 | 陷 | 入 | 无 | 政 | 府 | 状 | 态 | 成 | 群 | 的 | 人 | 们 | 在 | 街 | 上 | 游 | 荡 | 掠 | 夺 | 商 | 店 | 里 | 的 | 消 | 费 | 品 |',
  'num_samples': 309120,
  'gender': 'MALE'},
 {'id': 1699,
  'file_name': '2378996103615918493.wav',
  'raw_transcription': '一名观察者形容比什凯克(Bishkek)正在陷入“无政府“ 状态,成群的人们在街上游荡,掠夺商店里的消费品。',
  'transcription': '一 名 观 察 者 形 容 比 什 凯 克 bishkek 正 在 陷 入 无 政 府 状 态 成 群 的 人 们 在 街 上 游 荡 掠 夺 商 店 里 的 消 费 品',
  '_': '一 | 名 | 观 | 察 | 者 | 形 | 容 | 比 | 什 | 凯 | 克 | b i s h k e k | 正 | 在 | 陷 | 入 | 无 | 政 | 府 | 状 | 态 | 成 | 群 | 的 | 人 | 们 | 在 | 街 | 上 | 游 | 荡 | 掠 | 夺 | 商 | 店 | 里 | 的 | 消 | 费 | 品 |',
  'num_samples': 188160,
  'gender': 'MALE'},
 {'id': 1764,
  'file_name': '9945232777866779115.wav',
  'raw_transcription': '对于在圣彼得广场举行的葬礼,出席者太多了,因此不可能每个人都能进入。',
  'transcription': '对 于 在 圣 彼 得 广 场 举 行 的 葬 礼 出 席 者 太 多 了 因 此 不 可 能 每 个 人 都 能 进 入',
  '_': '对 | 于 | 在 | 圣 | 彼 | 得 | 广 | 场 | 举 | 行 | 的 | 葬 | 礼 | 出 | 席 | 者 | 太 | 多 | 了 | 因 | 此 | 不 | 可 | 能 | 每 | 个 | 人 | 都 | 能 | 进 | 入 |',
  'num_samples': 227200,
  'gender': 'MALE'},
 {'id': 1764,
  'file_name': '11058091657626476668.wav',
  'raw_transcription': '对于在圣彼得广场举行的葬礼,出席者太多了,因此不可能每个人都能进入。',
  'transcription': '对 于 在 圣 彼 得 广 场 举 行 的 葬 礼 出 席 者 太 多 了 因 此 不 可 能 每 个 人 都 能 进 入',
  '_': '对 | 于 | 在 | 圣 | 彼 | 得 | 广 | 场 | 举 | 行 | 的 | 葬 | 礼 | 出 | 席 | 者 | 太 | 多 | 了 | 因 | 此 | 不 | 可 | 能 | 每 | 个 | 人 | 都 | 能 | 进 | 入 |',
  'num_samples': 111360,
  'gender': 'FEMALE'},
 {'id': 1764,
  'file_name': '3973323679363917159.wav',
  'raw_transcription': '对于在圣彼得广场举行的葬礼,出席者太多了,因此不可能每个人都能进入。',
  'transcription': '对 于 在 圣 彼 得 广 场 举 行 的 葬 礼 出 席 者 太 多 了 因 此 不 可 能 每 个 人 都 能 进 入',
  '_': '对 | 于 | 在 | 圣 | 彼 | 得 | 广 | 场 | 举 | 行 | 的 | 葬 | 礼 | 出 | 席 | 者 | 太 | 多 | 了 | 因 | 此 | 不 | 可 | 能 | 每 | 个 | 人 | 都 | 能 | 进 | 入 |',
  'num_samples': 137280,
  'gender': 'MALE'},
 {'id': 1848,
  'file_name': '7146643706449814840.wav',
  'raw_transcription': '昨日上午,土耳其加齐安泰普(Gaziantep)的警察总部发生了一起汽车炸弹爆炸事件,该事件导致两名警察死亡,20 余人受伤。',
  'transcription': '昨 日 上 午 土 耳 其 加 齐 安 泰 普 gaziantep 的 警 察 总 部 发 生 了 一 起 汽 车 炸 弹 爆 炸 事 件 该 事 件 导 致 两 名 警 察 死 亡 20 余 人 受 伤',
  '_': '昨 | 日 | 上 | 午 | 土 | 耳 | 其 | 加 | 齐 | 安 | 泰 | 普 | g a z i a n t e p | 的 | 警 | 察 | 总 | 部 | 发 | 生 | 了 | 一 | 起 | 汽 | 车 | 炸 | 弹 | 爆 | 炸 | 事 | 件 | 该 | 事 | 件 | 导 | 致 | 两 | 名 | 警 | 察 | 死 | 亡 | 2 0 | 余 | 人 | 受 | 伤 |',
  'num_samples': 188160,
  'gender': 'FEMALE'},
 {'id': 1848,
  'file_name': '4170162240618647851.wav',
  'raw_transcription': '昨日上午,土耳其加齐安泰普(Gaziantep)的警察总部发生了一起汽车炸弹爆炸事件,该事件导致两名警察死亡,20 余人受伤。',
  'transcription': '昨 日 上 午 土 耳 其 加 齐 安 泰 普 gaziantep 的 警 察 总 部 发 生 了 一 起 汽 车 炸 弹 爆 炸 事 件 该 事 件 导 致 两 名 警 察 死 亡 20 余 人 受 伤',
  '_': '昨 | 日 | 上 | 午 | 土 | 耳 | 其 | 加 | 齐 | 安 | 泰 | 普 | g a z i a n t e p | 的 | 警 | 察 | 总 | 部 | 发 | 生 | 了 | 一 | 起 | 汽 | 车 | 炸 | 弹 | 爆 | 炸 | 事 | 件 | 该 | 事 | 件 | 导 | 致 | 两 | 名 | 警 | 察 | 死 | 亡 | 2 0 | 余 | 人 | 受 | 伤 |',
  'num_samples': 266560,
  'gender': 'MALE'},
 {'id': 1710,
  'file_name': '2561392937853668106.wav',
  'raw_transcription': '上周,日本经济产业省 (METI) 宣布,苹果公司向该部门通报另外 34 起过热造成的事故,尽管该公司称这些事故“并不严重”。',
  'transcription': '上 周 日 本 经 济 产 业 省 meti 宣 布 苹 果 公 司 向 该 部 门 通 报 另 外 34 起 过 热 造 成 的 事 故 尽 管 该 公 司 称 这 些 事 故 并 不 严 重',
  '_': '上 | 周 | 日 | 本 | 经 | 济 | 产 | 业 | 省 | m e t i | 宣 | 布 | 苹 | 果 | 公 | 司 | 向 | 该 | 部 | 门 | 通 | 报 | 另 | 外 | 3 4 | 起 | 过 | 热 | 造 | 成 | 的 | 事 | 故 | 尽 | 管 | 该 | 公 | 司 | 称 | 这 | 些 | 事 | 故 | 并 | 不 | 严 | 重 |',
  'num_samples': 210240,
  'gender': 'FEMALE'},
 {'id': 1710,
  'file_name': '8017113935896271861.wav',
  'raw_transcription': '上周,日本经济产业省 (METI) 宣布,苹果公司向该部门通报另外 34 起过热造成的事故,尽管该公司称这些事故“并不严重”。',
  'transcription': '上 周 日 本 经 济 产 业 省 meti 宣 布 苹 果 公 司 向 该 部 门 通 报 另 外 34 起 过 热 造 成 的 事 故 尽 管 该 公 司 称 这 些 事 故 并 不 严 重',
  '_': '上 | 周 | 日 | 本 | 经 | 济 | 产 | 业 | 省 | m e t i | 宣 | 布 | 苹 | 果 | 公 | 司 | 向 | 该 | 部 | 门 | 通 | 报 | 另 | 外 | 3 4 | 起 | 过 | 热 | 造 | 成 | 的 | 事 | 故 | 尽 | 管 | 该 | 公 | 司 | 称 | 这 | 些 | 事 | 故 | 并 | 不 | 严 | 重 |',
  'num_samples': 245120,
  'gender': 'MALE'},
 {'id': 2007,
  'file_name': '6904953527599225264.wav',
  'raw_transcription': '美国陆军工兵部队估计,6 英寸的降雨量就可能冲垮之前损坏的堤坝。',
  'transcription': '美 国 陆 军 工 兵 部 队 估 计 6 英 寸 的 降 雨 量 就 可 能 冲 垮 之 前 损 坏 的 堤 坝',
  '_': '美 | 国 | 陆 | 军 | 工 | 兵 | 部 | 队 | 估 | 计 | 6 | 英 | 寸 | 的 | 降 | 雨 | 量 | 就 | 可 | 能 | 冲 | 垮 | 之 | 前 | 损 | 坏 | 的 | 堤 | 坝 |',
  'num_samples': 165120,
  'gender': 'MALE'},
 {'id': 2007,
  'file_name': '7335843609415786856.wav',
  'raw_transcription': '美国陆军工兵部队估计,6 英寸的降雨量就可能冲垮之前损坏的堤坝。',
  'transcription': '美 国 陆 军 工 兵 部 队 估 计 6 英 寸 的 降 雨 量 就 可 能 冲 垮 之 前 损 坏 的 堤 坝',
  '_': '美 | 国 | 陆 | 军 | 工 | 兵 | 部 | 队 | 估 | 计 | 6 | 英 | 寸 | 的 | 降 | 雨 | 量 | 就 | 可 | 能 | 冲 | 垮 | 之 | 前 | 损 | 坏 | 的 | 堤 | 坝 |',
  'num_samples': 216320,
  'gender': 'MALE'},
 {'id': 2007,
  'file_name': '1717935295936178237.wav',
  'raw_transcription': '美国陆军工兵部队估计,6 英寸的降雨量就可能冲垮之前损坏的堤坝。',
  'transcription': '美 国 陆 军 工 兵 部 队 估 计 6 英 寸 的 降 雨 量 就 可 能 冲 垮 之 前 损 坏 的 堤 坝',
  '_': '美 | 国 | 陆 | 军 | 工 | 兵 | 部 | 队 | 估 | 计 | 6 | 英 | 寸 | 的 | 降 | 雨 | 量 | 就 | 可 | 能 | 冲 | 垮 | 之 | 前 | 损 | 坏 | 的 | 堤 | 坝 |',
  'num_samples': 195200,
  'gender': 'MALE'},
 {'id': 1935,
  'file_name': '7869813406685007810.wav',
  'raw_transcription': '然而事实并非如此。虽然这份文件的背面写了一些东西,但并是不一份藏宝图。',
  'transcription': '然 而 事 实 并 非 如 此 虽 然 这 份 文 件 的 背 面 写 了 一 些 东 西 但 并 是 不 一 份 藏 宝 图',
  '_': '然 | 而 | 事 | 实 | 并 | 非 | 如 | 此 | 虽 | 然 | 这 | 份 | 文 | 件 | 的 | 背 | 面 | 写 | 了 | 一 | 些 | 东 | 西 | 但 | 并 | 是 | 不 | 一 | 份 | 藏 | 宝 | 图 |',
  'num_samples': 127680,
  'gender': 'FEMALE'},
 {'id': 1679,
  'file_name': '15514325222679879585.wav',
  'raw_transcription': '空中铁匠乐队已经取消了他们巡回演唱会的剩余场次。',
  'transcription': '空 中 铁 匠 乐 队 已 经 取 消 了 他 们 巡 回 演 唱 会 的 剩 余 场 次',
  '_': '空 | 中 | 铁 | 匠 | 乐 | 队 | 已 | 经 | 取 | 消 | 了 | 他 | 们 | 巡 | 回 | 演 | 唱 | 会 | 的 | 剩 | 余 | 场 | 次 |',
  'num_samples': 154880,
  'gender': 'MALE'},
 {'id': 1679,
  'file_name': '277903012728871741.wav',
  'raw_transcription': '空中铁匠乐队已经取消了他们巡回演唱会的剩余场次。',
  'transcription': '空 中 铁 匠 乐 队 已 经 取 消 了 他 们 巡 回 演 唱 会 的 剩 余 场 次',
  '_': '空 | 中 | 铁 | 匠 | 乐 | 队 | 已 | 经 | 取 | 消 | 了 | 他 | 们 | 巡 | 回 | 演 | 唱 | 会 | 的 | 剩 | 余 | 场 | 次 |',
  'num_samples': 170240,
  'gender': 'MALE'},
 {'id': 1679,
  'file_name': '15655255953560947480.wav',
  'raw_transcription': '空中铁匠乐队已经取消了他们巡回演唱会的剩余场次。',
  'transcription': '空 中 铁 匠 乐 队 已 经 取 消 了 他 们 巡 回 演 唱 会 的 剩 余 场 次',
  '_': '空 | 中 | 铁 | 匠 | 乐 | 队 | 已 | 经 | 取 | 消 | 了 | 他 | 们 | 巡 | 回 | 演 | 唱 | 会 | 的 | 剩 | 余 | 场 | 次 |',
  'num_samples': 86400,
  'gender': 'FEMALE'},
 {'id': 1860,
  'file_name': '16170678538190250419.wav',
  'raw_transcription': '州长办公室表示,伤者中有十九人是警察。',
  'transcription': '州 长 办 公 室 表 示 伤 者 中 有 十 九 人 是 警 察',
  '_': '州 | 长 | 办 | 公 | 室 | 表 | 示 | 伤 | 者 | 中 | 有 | 十 | 九 | 人 | 是 | 警 | 察 |',
  'num_samples': 96000,
  'gender': 'MALE'},
 {'id': 1860,
  'file_name': '11738299611446203595.wav',
  'raw_transcription': '州长办公室表示,伤者中有十九人是警察。',
  'transcription': '州 长 办 公 室 表 示 伤 者 中 有 十 九 人 是 警 察',
  '_': '州 | 长 | 办 | 公 | 室 | 表 | 示 | 伤 | 者 | 中 | 有 | 十 | 九 | 人 | 是 | 警 | 察 |',
  'num_samples': 112320,
  'gender': 'MALE'},
 {'id': 1860,
  'file_name': '7237570981628024762.wav',
  'raw_transcription': '州长办公室表示,伤者中有十九人是警察。',
  'transcription': '州 长 办 公 室 表 示 伤 者 中 有 十 九 人 是 警 察',
  '_': '州 | 长 | 办 | 公 | 室 | 表 | 示 | 伤 | 者 | 中 | 有 | 十 | 九 | 人 | 是 | 警 | 察 |',
  'num_samples': 94080,
  'gender': 'FEMALE'},
 {'id': 1853,
  'file_name': '11297400535212590430.wav',
  'raw_transcription': '詹卡洛·费斯切拉因失去了对赛车的把控,在比赛开始后不久就退出了。',
  'transcription': '詹 卡 洛 费 斯 切 拉 因 失 去 了 对 赛 车 的 把 控 在 比 赛 开 始 后 不 久 就 退 出 了',
  '_': '詹 | 卡 | 洛 | 费 | 斯 | 切 | 拉 | 因 | 失 | 去 | 了 | 对 | 赛 | 车 | 的 | 把 | 控 | 在 | 比 | 赛 | 开 | 始 | 后 | 不 | 久 | 就 | 退 | 出 | 了 |',
  'num_samples': 255680,
  'gender': 'MALE'},
 {'id': 1853,
  'file_name': '9643962543472370350.wav',
  'raw_transcription': '詹卡洛·费斯切拉因失去了对赛车的把控,在比赛开始后不久就退出了。',
  'transcription': '詹 卡 洛 费 斯 切 拉 因 失 去 了 对 赛 车 的 把 控 在 比 赛 开 始 后 不 久 就 退 出 了',
  '_': '詹 | 卡 | 洛 | 费 | 斯 | 切 | 拉 | 因 | 失 | 去 | 了 | 对 | 赛 | 车 | 的 | 把 | 控 | 在 | 比 | 赛 | 开 | 始 | 后 | 不 | 久 | 就 | 退 | 出 | 了 |',
  'num_samples': 153600,
  'gender': 'FEMALE'},
 {'id': 1853,
  'file_name': '8409019300386154943.wav',
  'raw_transcription': '詹卡洛·费斯切拉因失去了对赛车的把控,在比赛开始后不久就退出了。',
  'transcription': '詹 卡 洛 费 斯 切 拉 因 失 去 了 对 赛 车 的 把 控 在 比 赛 开 始 后 不 久 就 退 出 了',
  '_': '詹 | 卡 | 洛 | 费 | 斯 | 切 | 拉 | 因 | 失 | 去 | 了 | 对 | 赛 | 车 | 的 | 把 | 控 | 在 | 比 | 赛 | 开 | 始 | 后 | 不 | 久 | 就 | 退 | 出 | 了 |',
  'num_samples': 218880,
  'gender': 'MALE'},
 {'id': 2001,
  'file_name': '7769305805697259437.wav',
  'raw_transcription': '强烈建议旅客注意所在地的恶劣天气风险,它们可能会影响旅行计划。',
  'transcription': '强 烈 建 议 旅 客 注 意 所 在 地 的 恶 劣 天 气 风 险 它 们 可 能 会 影 响 旅 行 计 划',
  '_': '强 | 烈 | 建 | 议 | 旅 | 客 | 注 | 意 | 所 | 在 | 地 | 的 | 恶 | 劣 | 天 | 气 | 风 | 险 | 它 | 们 | 可 | 能 | 会 | 影 | 响 | 旅 | 行 | 计 | 划 |',
  'num_samples': 110400,
  'gender': 'FEMALE'},
 {'id': 2001,
  'file_name': '3701454187093730515.wav',
  'raw_transcription': '强烈建议旅客注意所在地的恶劣天气风险,它们可能会影响旅行计划。',
  'transcription': '强 烈 建 议 旅 客 注 意 所 在 地 的 恶 劣 天 气 风 险 它 们 可 能 会 影 响 旅 行 计 划',
  '_': '强 | 烈 | 建 | 议 | 旅 | 客 | 注 | 意 | 所 | 在 | 地 | 的 | 恶 | 劣 | 天 | 气 | 风 | 险 | 它 | 们 | 可 | 能 | 会 | 影 | 响 | 旅 | 行 | 计 | 划 |',
  'num_samples': 146880,
  'gender': 'MALE'},
 {'id': 2001,
  'file_name': '14421904810944330125.wav',
  'raw_transcription': '强烈建议旅客注意所在地的恶劣天气风险,它们可能会影响旅行计划。',
  'transcription': '强 烈 建 议 旅 客 注 意 所 在 地 的 恶 劣 天 气 风 险 它 们 可 能 会 影 响 旅 行 计 划',
  '_': '强 | 烈 | 建 | 议 | 旅 | 客 | 注 | 意 | 所 | 在 | 地 | 的 | 恶 | 劣 | 天 | 气 | 风 | 险 | 它 | 们 | 可 | 能 | 会 | 影 | 响 | 旅 | 行 | 计 | 划 |',
  'num_samples': 123840,
  'gender': 'FEMALE'},
 {'id': 1794,
  'file_name': '15610115668837304787.wav',
  'raw_transcription': '文明是一种由共同生活、合作工作的人群(社会)所共享的单一文化。',
  'transcription': '文 明 是 一 种 由 共 同 生 活 合 作 工 作 的 人 群 社 会 所 共 享 的 单 一 文 化',
  '_': '文 | 明 | 是 | 一 | 种 | 由 | 共 | 同 | 生 | 活 | 合 | 作 | 工 | 作 | 的 | 人 | 群 | 社 | 会 | 所 | 共 | 享 | 的 | 单 | 一 | 文 | 化 |',
  'num_samples': 109440,
  'gender': 'FEMALE'},
 {'id': 1794,
  'file_name': '16491962224991438735.wav',
  'raw_transcription': '文明是一种由共同生活、合作工作的人群(社会)所共享的单一文化。',
  'transcription': '文 明 是 一 种 由 共 同 生 活 合 作 工 作 的 人 群 社 会 所 共 享 的 单 一 文 化',
  '_': '文 | 明 | 是 | 一 | 种 | 由 | 共 | 同 | 生 | 活 | 合 | 作 | 工 | 作 | 的 | 人 | 群 | 社 | 会 | 所 | 共 | 享 | 的 | 单 | 一 | 文 | 化 |',
  'num_samples': 125760,
  'gender': 'FEMALE'},
 {'id': 1794,
  'file_name': '2516092161148738154.wav',
  'raw_transcription': '文明是一种由共同生活、合作工作的人群(社会)所共享的单一文化。',
  'transcription': '文 明 是 一 种 由 共 同 生 活 合 作 工 作 的 人 群 社 会 所 共 享 的 单 一 文 化',
  '_': '文 | 明 | 是 | 一 | 种 | 由 | 共 | 同 | 生 | 活 | 合 | 作 | 工 | 作 | 的 | 人 | 群 | 社 | 会 | 所 | 共 | 享 | 的 | 单 | 一 | 文 | 化 |',
  'num_samples': 140160,
  'gender': 'FEMALE'},
 {'id': 1717,
  'file_name': '6119869420349327544.wav',
  'raw_transcription': '水下的地形造成回流集中于几处较深的区域,那里可能会形成流向深水的急流。',
  'transcription': '水 下 的 地 形 造 成 回 流 集 中 于 几 处 较 深 的 区 域 那 里 可 能 会 形 成 流 向 深 水 的 急 流',
  '_': '水 | 下 | 的 | 地 | 形 | 造 | 成 | 回 | 流 | 集 | 中 | 于 | 几 | 处 | 较 | 深 | 的 | 区 | 域 | 那 | 里 | 可 | 能 | 会 | 形 | 成 | 流 | 向 | 深 | 水 | 的 | 急 | 流 |',
  'num_samples': 216960,
  'gender': 'MALE'},
 {'id': 1717,
  'file_name': '9832338951018379465.wav',
  'raw_transcription': '水下的地形造成回流集中于几处较深的区域,那里可能会形成流向深水的急流。',
  'transcription': '水 下 的 地 形 造 成 回 流 集 中 于 几 处 较 深 的 区 域 那 里 可 能 会 形 成 流 向 深 水 的 急 流',
  '_': '水 | 下 | 的 | 地 | 形 | 造 | 成 | 回 | 流 | 集 | 中 | 于 | 几 | 处 | 较 | 深 | 的 | 区 | 域 | 那 | 里 | 可 | 能 | 会 | 形 | 成 | 流 | 向 | 深 | 水 | 的 | 急 | 流 |',
  'num_samples': 243840,
  'gender': 'MALE'},
 {'id': 1717,
  'file_name': '2608215672368482563.wav',
  'raw_transcription': '水下的地形造成回流集中于几处较深的区域,那里可能会形成流向深水的急流。',
  'transcription': '水 下 的 地 形 造 成 回 流 集 中 于 几 处 较 深 的 区 域 那 里 可 能 会 形 成 流 向 深 水 的 急 流',
  '_': '水 | 下 | 的 | 地 | 形 | 造 | 成 | 回 | 流 | 集 | 中 | 于 | 几 | 处 | 较 | 深 | 的 | 区 | 域 | 那 | 里 | 可 | 能 | 会 | 形 | 成 | 流 | 向 | 深 | 水 | 的 | 急 | 流 |',
  'num_samples': 263360,
  'gender': 'MALE'},
 {'id': 1745,
  'file_name': '2808841965582657611.wav',
  'raw_transcription': '植物在自然环境中状态最好。因此要抵住诱惑,不去摘掉植物,哪怕“只是一株”。',
  'transcription': '植 物 在 自 然 环 境 中 状 态 最 好 因 此 要 抵 住 诱 惑 不 去 摘 掉 植 物 哪 怕 只 是 一 株',
  '_': '植 | 物 | 在 | 自 | 然 | 环 | 境 | 中 | 状 | 态 | 最 | 好 | 因 | 此 | 要 | 抵 | 住 | 诱 | 惑 | 不 | 去 | 摘 | 掉 | 植 | 物 | 哪 | 怕 | 只 | 是 | 一 | 株 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1745,
  'file_name': '7485992766206519433.wav',
  'raw_transcription': '植物在自然环境中状态最好。因此要抵住诱惑,不去摘掉植物,哪怕“只是一株”。',
  'transcription': '植 物 在 自 然 环 境 中 状 态 最 好 因 此 要 抵 住 诱 惑 不 去 摘 掉 植 物 哪 怕 只 是 一 株',
  '_': '植 | 物 | 在 | 自 | 然 | 环 | 境 | 中 | 状 | 态 | 最 | 好 | 因 | 此 | 要 | 抵 | 住 | 诱 | 惑 | 不 | 去 | 摘 | 掉 | 植 | 物 | 哪 | 怕 | 只 | 是 | 一 | 株 |',
  'num_samples': 233920,
  'gender': 'MALE'},
 {'id': 1815,
  'file_name': '8796485419234588472.wav',
  'raw_transcription': '裂变原子弹的工作原理如下:把一个原子核和许多质子及中子聚在一起需要能量。',
  'transcription': '裂 变 原 子 弹 的 工 作 原 理 如 下 把 一 个 原 子 核 和 许 多 质 子 及 中 子 聚 在 一 起 需 要 能 量',
  '_': '裂 | 变 | 原 | 子 | 弹 | 的 | 工 | 作 | 原 | 理 | 如 | 下 | 把 | 一 | 个 | 原 | 子 | 核 | 和 | 许 | 多 | 质 | 子 | 及 | 中 | 子 | 聚 | 在 | 一 | 起 | 需 | 要 | 能 | 量 |',
  'num_samples': 215360,
  'gender': 'MALE'},
 {'id': 1815,
  'file_name': '1713387322441230443.wav',
  'raw_transcription': '裂变原子弹的工作原理如下:把一个原子核和许多质子及中子聚在一起需要能量。',
  'transcription': '裂 变 原 子 弹 的 工 作 原 理 如 下 把 一 个 原 子 核 和 许 多 质 子 及 中 子 聚 在 一 起 需 要 能 量',
  '_': '裂 | 变 | 原 | 子 | 弹 | 的 | 工 | 作 | 原 | 理 | 如 | 下 | 把 | 一 | 个 | 原 | 子 | 核 | 和 | 许 | 多 | 质 | 子 | 及 | 中 | 子 | 聚 | 在 | 一 | 起 | 需 | 要 | 能 | 量 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1815,
  'file_name': '8994105395560976791.wav',
  'raw_transcription': '裂变原子弹的工作原理如下:把一个原子核和许多质子及中子聚在一起需要能量。',
  'transcription': '裂 变 原 子 弹 的 工 作 原 理 如 下 把 一 个 原 子 核 和 许 多 质 子 及 中 子 聚 在 一 起 需 要 能 量',
  '_': '裂 | 变 | 原 | 子 | 弹 | 的 | 工 | 作 | 原 | 理 | 如 | 下 | 把 | 一 | 个 | 原 | 子 | 核 | 和 | 许 | 多 | 质 | 子 | 及 | 中 | 子 | 聚 | 在 | 一 | 起 | 需 | 要 | 能 | 量 |',
  'num_samples': 126720,
  'gender': 'FEMALE'},
 {'id': 1895,
  'file_name': '4311928890660363024.wav',
  'raw_transcription': '随着希腊知识的衰落,西方脱离了其希腊哲学和科学根源。',
  'transcription': '随 着 希 腊 知 识 的 衰 落 西 方 脱 离 了 其 希 腊 哲 学 和 科 学 根 源',
  '_': '随 | 着 | 希 | 腊 | 知 | 识 | 的 | 衰 | 落 | 西 | 方 | 脱 | 离 | 了 | 其 | 希 | 腊 | 哲 | 学 | 和 | 科 | 学 | 根 | 源 |',
  'num_samples': 100800,
  'gender': 'FEMALE'},
 {'id': 1895,
  'file_name': '16949318249271505602.wav',
  'raw_transcription': '随着希腊知识的衰落,西方脱离了其希腊哲学和科学根源。',
  'transcription': '随 着 希 腊 知 识 的 衰 落 西 方 脱 离 了 其 希 腊 哲 学 和 科 学 根 源',
  '_': '随 | 着 | 希 | 腊 | 知 | 识 | 的 | 衰 | 落 | 西 | 方 | 脱 | 离 | 了 | 其 | 希 | 腊 | 哲 | 学 | 和 | 科 | 学 | 根 | 源 |',
  'num_samples': 89280,
  'gender': 'FEMALE'},
 {'id': 1895,
  'file_name': '983540233864149941.wav',
  'raw_transcription': '随着希腊知识的衰落,西方脱离了其希腊哲学和科学根源。',
  'transcription': '随 着 希 腊 知 识 的 衰 落 西 方 脱 离 了 其 希 腊 哲 学 和 科 学 根 源',
  '_': '随 | 着 | 希 | 腊 | 知 | 识 | 的 | 衰 | 落 | 西 | 方 | 脱 | 离 | 了 | 其 | 希 | 腊 | 哲 | 学 | 和 | 科 | 学 | 根 | 源 |',
  'num_samples': 96000,
  'gender': 'FEMALE'},
 {'id': 1684,
  'file_name': '6434743737829208648.wav',
  'raw_transcription': '阿皮亚是萨摩亚的首都。该城镇位于乌波卢(Upolu)岛上,人口数量不足 4 万。',
  'transcription': '阿 皮 亚 是 萨 摩 亚 的 首 都 该 城 镇 位 于 乌 波 卢 upolu 岛 上 人 口 数 量 不 足 4 万',
  '_': '阿 | 皮 | 亚 | 是 | 萨 | 摩 | 亚 | 的 | 首 | 都 | 该 | 城 | 镇 | 位 | 于 | 乌 | 波 | 卢 | u p o l u | 岛 | 上 | 人 | 口 | 数 | 量 | 不 | 足 | 4 | 万 |',
  'num_samples': 237760,
  'gender': 'MALE'},
 {'id': 1867,
  'file_name': '3633749473030786535.wav',
  'raw_transcription': '植物能制造人类吸入的氧气,吸收人类呼出的二氧化碳。',
  'transcription': '植 物 能 制 造 人 类 吸 入 的 氧 气 吸 收 人 类 呼 出 的 二 氧 化 碳',
  '_': '植 | 物 | 能 | 制 | 造 | 人 | 类 | 吸 | 入 | 的 | 氧 | 气 | 吸 | 收 | 人 | 类 | 呼 | 出 | 的 | 二 | 氧 | 化 | 碳 |',
  'num_samples': 83520,
  'gender': 'FEMALE'},
 {'id': 1867,
  'file_name': '17251775862374398296.wav',
  'raw_transcription': '植物能制造人类吸入的氧气,吸收人类呼出的二氧化碳。',
  'transcription': '植 物 能 制 造 人 类 吸 入 的 氧 气 吸 收 人 类 呼 出 的 二 氧 化 碳',
  '_': '植 | 物 | 能 | 制 | 造 | 人 | 类 | 吸 | 入 | 的 | 氧 | 气 | 吸 | 收 | 人 | 类 | 呼 | 出 | 的 | 二 | 氧 | 化 | 碳 |',
  'num_samples': 96960,
  'gender': 'FEMALE'},
 {'id': 1867,
  'file_name': '8788773255683751695.wav',
  'raw_transcription': '植物能制造人类吸入的氧气,吸收人类呼出的二氧化碳。',
  'transcription': '植 物 能 制 造 人 类 吸 入 的 氧 气 吸 收 人 类 呼 出 的 二 氧 化 碳',
  '_': '植 | 物 | 能 | 制 | 造 | 人 | 类 | 吸 | 入 | 的 | 氧 | 气 | 吸 | 收 | 人 | 类 | 呼 | 出 | 的 | 二 | 氧 | 化 | 碳 |',
  'num_samples': 104640,
  'gender': 'MALE'},
 {'id': 1806,
  'file_name': '4527058471786347963.wav',
  'raw_transcription': '由于在其全盛时期的光污染还不像现在这么严重,所以天文台通常建立在城区或校园内,比现代修建的天文台更容易到达。',
  'transcription': '由 于 在 其 全 盛 时 期 的 光 污 染 还 不 像 现 在 这 么 严 重 所 以 天 文 台 通 常 建 立 在 城 区 或 校 园 内 比 现 代 修 建 的 天 文 台 更 容 易 到 达',
  '_': '由 | 于 | 在 | 其 | 全 | 盛 | 时 | 期 | 的 | 光 | 污 | 染 | 还 | 不 | 像 | 现 | 在 | 这 | 么 | 严 | 重 | 所 | 以 | 天 | 文 | 台 | 通 | 常 | 建 | 立 | 在 | 城 | 区 | 或 | 校 | 园 | 内 | 比 | 现 | 代 | 修 | 建 | 的 | 天 | 文 | 台 | 更 | 容 | 易 | 到 | 达 |',
  'num_samples': 170880,
  'gender': 'FEMALE'},
 {'id': 1806,
  'file_name': '4135933177284898962.wav',
  'raw_transcription': '由于在其全盛时期的光污染还不像现在这么严重,所以天文台通常建立在城区或校园内,比现代修建的天文台更容易到达。',
  'transcription': '由 于 在 其 全 盛 时 期 的 光 污 染 还 不 像 现 在 这 么 严 重 所 以 天 文 台 通 常 建 立 在 城 区 或 校 园 内 比 现 代 修 建 的 天 文 台 更 容 易 到 达',
  '_': '由 | 于 | 在 | 其 | 全 | 盛 | 时 | 期 | 的 | 光 | 污 | 染 | 还 | 不 | 像 | 现 | 在 | 这 | 么 | 严 | 重 | 所 | 以 | 天 | 文 | 台 | 通 | 常 | 建 | 立 | 在 | 城 | 区 | 或 | 校 | 园 | 内 | 比 | 现 | 代 | 修 | 建 | 的 | 天 | 文 | 台 | 更 | 容 | 易 | 到 | 达 |',
  'num_samples': 214080,
  'gender': 'MALE'},
 {'id': 1798,
  'file_name': '5911371549960676194.wav',
  'raw_transcription': '早年,该节目仅在运营已久的互联网广播网站TogiNet Radio上播出,TogiNet Radio是一个专注于谈话广播的网站。',
  'transcription': '早 年 该 节 目 仅 在 运 营 已 久 的 互 联 网 广 播 网 站 toginet radio 上 播 出 toginet radio 是 一 个 专 注 于 谈 话 广 播 的 网 站',
  '_': '早 | 年 | 该 | 节 | 目 | 仅 | 在 | 运 | 营 | 已 | 久 | 的 | 互 | 联 | 网 | 广 | 播 | 网 | 站 | t o g i n e t | r a d i o | 上 | 播 | 出 | t o g i n e t | r a d i o | 是 | 一 | 个 | 专 | 注 | 于 | 谈 | 话 | 广 | 播 | 的 | 网 | 站 |',
  'num_samples': 202560,
  'gender': 'MALE'},
 {'id': 1798,
  'file_name': '8818535824083051897.wav',
  'raw_transcription': '早年,该节目仅在运营已久的互联网广播网站TogiNet Radio上播出,TogiNet Radio是一个专注于谈话广播的网站。',
  'transcription': '早 年 该 节 目 仅 在 运 营 已 久 的 互 联 网 广 播 网 站 toginet radio 上 播 出 toginet radio 是 一 个 专 注 于 谈 话 广 播 的 网 站',
  '_': '早 | 年 | 该 | 节 | 目 | 仅 | 在 | 运 | 营 | 已 | 久 | 的 | 互 | 联 | 网 | 广 | 播 | 网 | 站 | t o g i n e t | r a d i o | 上 | 播 | 出 | t o g i n e t | r a d i o | 是 | 一 | 个 | 专 | 注 | 于 | 谈 | 话 | 广 | 播 | 的 | 网 | 站 |',
  'num_samples': 165120,
  'gender': 'FEMALE'},
 {'id': 1798,
  'file_name': '13567797441958644730.wav',
  'raw_transcription': '早年,该节目仅在运营已久的互联网广播网站TogiNet Radio上播出,TogiNet Radio是一个专注于谈话广播的网站。',
  'transcription': '早 年 该 节 目 仅 在 运 营 已 久 的 互 联 网 广 播 网 站 toginet radio 上 播 出 toginet radio 是 一 个 专 注 于 谈 话 广 播 的 网 站',
  '_': '早 | 年 | 该 | 节 | 目 | 仅 | 在 | 运 | 营 | 已 | 久 | 的 | 互 | 联 | 网 | 广 | 播 | 网 | 站 | t o g i n e t | r a d i o | 上 | 播 | 出 | t o g i n e t | r a d i o | 是 | 一 | 个 | 专 | 注 | 于 | 谈 | 话 | 广 | 播 | 的 | 网 | 站 |',
  'num_samples': 165120,
  'gender': 'FEMALE'},
 {'id': 1735,
  'file_name': '8866109507232163465.wav',
  'raw_transcription': '来自美国普林斯顿大学和瑞典乌普萨拉大学的研究人员报告称,由于当地特有的达尔文雀中的勇地雀和外来的仙人掌大嘴地雀之间的繁殖,这个新物种只进化了两代,尽管人们认为这一过程需要更长的时间。',
  'transcription': '来 自 美 国 普 林 斯 顿 大 学 和 瑞 典 乌 普 萨 拉 大 学 的 研 究 人 员 报 告 称 由 于 当 地 特 有 的 达 尔 文 雀 中 的 勇 地 雀 和 外 来 的 仙 人 掌 大 嘴 地 雀 之 间 的 繁 殖 这 个 新 物 种 只 进 化 了 两 代 尽 管 人 们 认 为 这 一 过 程 需 要 更 长 的 时 间',
  '_': '来 | 自 | 美 | 国 | 普 | 林 | 斯 | 顿 | 大 | 学 | 和 | 瑞 | 典 | 乌 | 普 | 萨 | 拉 | 大 | 学 | 的 | 研 | 究 | 人 | 员 | 报 | 告 | 称 | 由 | 于 | 当 | 地 | 特 | 有 | 的 | 达 | 尔 | 文 | 雀 | 中 | 的 | 勇 | 地 | 雀 | 和 | 外 | 来 | 的 | 仙 | 人 | 掌 | 大 | 嘴 | 地 | 雀 | 之 | 间 | 的 | 繁 | 殖 | 这 | 个 | 新 | 物 | 种 | 只 | 进 | 化 | 了 | 两 | 代 | 尽 | 管 | 人 | 们 | 认 | 为 | 这 | 一 | 过 | 程 | 需 | 要 | 更 | 长 | 的 | 时 | 间 |',
  'num_samples': 296640,
  'gender': 'MALE'},
 {'id': 1735,
  'file_name': '11200349212664177752.wav',
  'raw_transcription': '来自美国普林斯顿大学和瑞典乌普萨拉大学的研究人员报告称,由于当地特有的达尔文雀中的勇地雀和外来的仙人掌大嘴地雀之间的繁殖,这个新物种只进化了两代,尽管人们认为这一过程需要更长的时间。',
  'transcription': '来 自 美 国 普 林 斯 顿 大 学 和 瑞 典 乌 普 萨 拉 大 学 的 研 究 人 员 报 告 称 由 于 当 地 特 有 的 达 尔 文 雀 中 的 勇 地 雀 和 外 来 的 仙 人 掌 大 嘴 地 雀 之 间 的 繁 殖 这 个 新 物 种 只 进 化 了 两 代 尽 管 人 们 认 为 这 一 过 程 需 要 更 长 的 时 间',
  '_': '来 | 自 | 美 | 国 | 普 | 林 | 斯 | 顿 | 大 | 学 | 和 | 瑞 | 典 | 乌 | 普 | 萨 | 拉 | 大 | 学 | 的 | 研 | 究 | 人 | 员 | 报 | 告 | 称 | 由 | 于 | 当 | 地 | 特 | 有 | 的 | 达 | 尔 | 文 | 雀 | 中 | 的 | 勇 | 地 | 雀 | 和 | 外 | 来 | 的 | 仙 | 人 | 掌 | 大 | 嘴 | 地 | 雀 | 之 | 间 | 的 | 繁 | 殖 | 这 | 个 | 新 | 物 | 种 | 只 | 进 | 化 | 了 | 两 | 代 | 尽 | 管 | 人 | 们 | 认 | 为 | 这 | 一 | 过 | 程 | 需 | 要 | 更 | 长 | 的 | 时 | 间 |',
  'num_samples': 331200,
  'gender': 'FEMALE'},
 {'id': 1735,
  'file_name': '16937427017929771951.wav',
  'raw_transcription': '来自美国普林斯顿大学和瑞典乌普萨拉大学的研究人员报告称,由于当地特有的达尔文雀中的勇地雀和外来的仙人掌大嘴地雀之间的繁殖,这个新物种只进化了两代,尽管人们认为这一过程需要更长的时间。',
  'transcription': '来 自 美 国 普 林 斯 顿 大 学 和 瑞 典 乌 普 萨 拉 大 学 的 研 究 人 员 报 告 称 由 于 当 地 特 有 的 达 尔 文 雀 中 的 勇 地 雀 和 外 来 的 仙 人 掌 大 嘴 地 雀 之 间 的 繁 殖 这 个 新 物 种 只 进 化 了 两 代 尽 管 人 们 认 为 这 一 过 程 需 要 更 长 的 时 间',
  '_': '来 | 自 | 美 | 国 | 普 | 林 | 斯 | 顿 | 大 | 学 | 和 | 瑞 | 典 | 乌 | 普 | 萨 | 拉 | 大 | 学 | 的 | 研 | 究 | 人 | 员 | 报 | 告 | 称 | 由 | 于 | 当 | 地 | 特 | 有 | 的 | 达 | 尔 | 文 | 雀 | 中 | 的 | 勇 | 地 | 雀 | 和 | 外 | 来 | 的 | 仙 | 人 | 掌 | 大 | 嘴 | 地 | 雀 | 之 | 间 | 的 | 繁 | 殖 | 这 | 个 | 新 | 物 | 种 | 只 | 进 | 化 | 了 | 两 | 代 | 尽 | 管 | 人 | 们 | 认 | 为 | 这 | 一 | 过 | 程 | 需 | 要 | 更 | 长 | 的 | 时 | 间 |',
  'num_samples': 351360,
  'gender': 'MALE'},
 {'id': 1858,
  'file_name': '13792944605160254752.wav',
  'raw_transcription': '研究该疾病的联合国专家丹妮尔·拉塔涅 (Danielle Lantagne) 表示,疫情爆发很可能是由维和人员引起的。',
  'transcription': '研 究 该 疾 病 的 联 合 国 专 家 丹 妮 尔 拉 塔 涅 danielle lantagne 表 示 疫 情 爆 发 很 可 能 是 由 维 和 人 员 引 起 的',
  '_': '研 | 究 | 该 | 疾 | 病 | 的 | 联 | 合 | 国 | 专 | 家 | 丹 | 妮 | 尔 | 拉 | 塔 | 涅 | d a n i e l l e | l a n t a g n e | 表 | 示 | 疫 | 情 | 爆 | 发 | 很 | 可 | 能 | 是 | 由 | 维 | 和 | 人 | 员 | 引 | 起 | 的 |',
  'num_samples': 175680,
  'gender': 'MALE'},
 {'id': 1858,
  'file_name': '2932636263941166076.wav',
  'raw_transcription': '研究该疾病的联合国专家丹妮尔·拉塔涅 (Danielle Lantagne) 表示,疫情爆发很可能是由维和人员引起的。',
  'transcription': '研 究 该 疾 病 的 联 合 国 专 家 丹 妮 尔 拉 塔 涅 danielle lantagne 表 示 疫 情 爆 发 很 可 能 是 由 维 和 人 员 引 起 的',
  '_': '研 | 究 | 该 | 疾 | 病 | 的 | 联 | 合 | 国 | 专 | 家 | 丹 | 妮 | 尔 | 拉 | 塔 | 涅 | d a n i e l l e | l a n t a g n e | 表 | 示 | 疫 | 情 | 爆 | 发 | 很 | 可 | 能 | 是 | 由 | 维 | 和 | 人 | 员 | 引 | 起 | 的 |',
  'num_samples': 273920,
  'gender': 'MALE'},
 {'id': 1858,
  'file_name': '11405581964812220670.wav',
  'raw_transcription': '研究该疾病的联合国专家丹妮尔·拉塔涅 (Danielle Lantagne) 表示,疫情爆发很可能是由维和人员引起的。',
  'transcription': '研 究 该 疾 病 的 联 合 国 专 家 丹 妮 尔 拉 塔 涅 danielle lantagne 表 示 疫 情 爆 发 很 可 能 是 由 维 和 人 员 引 起 的',
  '_': '研 | 究 | 该 | 疾 | 病 | 的 | 联 | 合 | 国 | 专 | 家 | 丹 | 妮 | 尔 | 拉 | 塔 | 涅 | d a n i e l l e | l a n t a g n e | 表 | 示 | 疫 | 情 | 爆 | 发 | 很 | 可 | 能 | 是 | 由 | 维 | 和 | 人 | 员 | 引 | 起 | 的 |',
  'num_samples': 150720,
  'gender': 'FEMALE'},
 {'id': 1994,
  'file_name': '5323502856288307832.wav',
  'raw_transcription': '毋庸置疑的是,如果你会讲一门罗曼语,那么学习葡萄牙语会更加容易。',
  'transcription': '毋 庸 置 疑 的 是 如 果 你 会 讲 一 门 罗 曼 语 那 么 学 习 葡 萄 牙 语 会 更 加 容 易',
  '_': '毋 | 庸 | 置 | 疑 | 的 | 是 | 如 | 果 | 你 | 会 | 讲 | 一 | 门 | 罗 | 曼 | 语 | 那 | 么 | 学 | 习 | 葡 | 萄 | 牙 | 语 | 会 | 更 | 加 | 容 | 易 |',
  'num_samples': 185920,
  'gender': 'MALE'},
 {'id': 1994,
  'file_name': '9651222294664914543.wav',
  'raw_transcription': '毋庸置疑的是,如果你会讲一门罗曼语,那么学习葡萄牙语会更加容易。',
  'transcription': '毋 庸 置 疑 的 是 如 果 你 会 讲 一 门 罗 曼 语 那 么 学 习 葡 萄 牙 语 会 更 加 容 易',
  '_': '毋 | 庸 | 置 | 疑 | 的 | 是 | 如 | 果 | 你 | 会 | 讲 | 一 | 门 | 罗 | 曼 | 语 | 那 | 么 | 学 | 习 | 葡 | 萄 | 牙 | 语 | 会 | 更 | 加 | 容 | 易 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 1872,
  'file_name': '8538608467298888133.wav',
  'raw_transcription': '在由茅茅运动为争取独立而组织发起的斗争中,该镇的一场和平集会致使大酋长图普阿·塔马塞塞·利罗菲三世(Tupua Tamasese Lealofi III)遇害身亡。',
  'transcription': '在 由 茅 茅 运 动 为 争 取 独 立 而 组 织 发 起 的 斗 争 中 该 镇 的 一 场 和 平 集 会 致 使 大 酋 长 图 普 阿 塔 马 塞 塞 利 罗 菲 三 世 tupua tamasese lealofi iii 遇 害 身 亡',
  '_': '在 | 由 | 茅 | 茅 | 运 | 动 | 为 | 争 | 取 | 独 | 立 | 而 | 组 | 织 | 发 | 起 | 的 | 斗 | 争 | 中 | 该 | 镇 | 的 | 一 | 场 | 和 | 平 | 集 | 会 | 致 | 使 | 大 | 酋 | 长 | 图 | 普 | 阿 | 塔 | 马 | 塞 | 塞 | 利 | 罗 | 菲 | 三 | 世 | t u p u a | t a m a s e s e | l e a l o f i | i i i | 遇 | 害 | 身 | 亡 |',
  'num_samples': 291840,
  'gender': 'MALE'},
 {'id': 1872,
  'file_name': '7453046023372822093.wav',
  'raw_transcription': '在由茅茅运动为争取独立而组织发起的斗争中,该镇的一场和平集会致使大酋长图普阿·塔马塞塞·利罗菲三世(Tupua Tamasese Lealofi III)遇害身亡。',
  'transcription': '在 由 茅 茅 运 动 为 争 取 独 立 而 组 织 发 起 的 斗 争 中 该 镇 的 一 场 和 平 集 会 致 使 大 酋 长 图 普 阿 塔 马 塞 塞 利 罗 菲 三 世 tupua tamasese lealofi iii 遇 害 身 亡',
  '_': '在 | 由 | 茅 | 茅 | 运 | 动 | 为 | 争 | 取 | 独 | 立 | 而 | 组 | 织 | 发 | 起 | 的 | 斗 | 争 | 中 | 该 | 镇 | 的 | 一 | 场 | 和 | 平 | 集 | 会 | 致 | 使 | 大 | 酋 | 长 | 图 | 普 | 阿 | 塔 | 马 | 塞 | 塞 | 利 | 罗 | 菲 | 三 | 世 | t u p u a | t a m a s e s e | l e a l o f i | i i i | 遇 | 害 | 身 | 亡 |',
  'num_samples': 262080,
  'gender': 'MALE'},
 {'id': 1872,
  'file_name': '18412694451387197092.wav',
  'raw_transcription': '在由茅茅运动为争取独立而组织发起的斗争中,该镇的一场和平集会致使大酋长图普阿·塔马塞塞·利罗菲三世(Tupua Tamasese Lealofi III)遇害身亡。',
  'transcription': '在 由 茅 茅 运 动 为 争 取 独 立 而 组 织 发 起 的 斗 争 中 该 镇 的 一 场 和 平 集 会 致 使 大 酋 长 图 普 阿 塔 马 塞 塞 利 罗 菲 三 世 tupua tamasese lealofi iii 遇 害 身 亡',
  '_': '在 | 由 | 茅 | 茅 | 运 | 动 | 为 | 争 | 取 | 独 | 立 | 而 | 组 | 织 | 发 | 起 | 的 | 斗 | 争 | 中 | 该 | 镇 | 的 | 一 | 场 | 和 | 平 | 集 | 会 | 致 | 使 | 大 | 酋 | 长 | 图 | 普 | 阿 | 塔 | 马 | 塞 | 塞 | 利 | 罗 | 菲 | 三 | 世 | t u p u a | t a m a s e s e | l e a l o f i | i i i | 遇 | 害 | 身 | 亡 |',
  'num_samples': 240960,
  'gender': 'MALE'},
 {'id': 1709,
  'file_name': '8386178783748510855.wav',
  'raw_transcription': '该报告对行政当局目前对伊拉克政策的几乎每一个方面都提出了严厉批评,并敦促立即改变方向。',
  'transcription': '该 报 告 对 行 政 当 局 目 前 对 伊 拉 克 政 策 的 几 乎 每 一 个 方 面 都 提 出 了 严 厉 批 评 并 敦 促 立 即 改 变 方 向',
  '_': '该 | 报 | 告 | 对 | 行 | 政 | 当 | 局 | 目 | 前 | 对 | 伊 | 拉 | 克 | 政 | 策 | 的 | 几 | 乎 | 每 | 一 | 个 | 方 | 面 | 都 | 提 | 出 | 了 | 严 | 厉 | 批 | 评 | 并 | 敦 | 促 | 立 | 即 | 改 | 变 | 方 | 向 |',
  'num_samples': 187200,
  'gender': 'MALE'},
 {'id': 1709,
  'file_name': '11174681987322193954.wav',
  'raw_transcription': '该报告对行政当局目前对伊拉克政策的几乎每一个方面都提出了严厉批评,并敦促立即改变方向。',
  'transcription': '该 报 告 对 行 政 当 局 目 前 对 伊 拉 克 政 策 的 几 乎 每 一 个 方 面 都 提 出 了 严 厉 批 评 并 敦 促 立 即 改 变 方 向',
  '_': '该 | 报 | 告 | 对 | 行 | 政 | 当 | 局 | 目 | 前 | 对 | 伊 | 拉 | 克 | 政 | 策 | 的 | 几 | 乎 | 每 | 一 | 个 | 方 | 面 | 都 | 提 | 出 | 了 | 严 | 厉 | 批 | 评 | 并 | 敦 | 促 | 立 | 即 | 改 | 变 | 方 | 向 |',
  'num_samples': 165120,
  'gender': 'MALE'},
 {'id': 1709,
  'file_name': '211832247200046048.wav',
  'raw_transcription': '该报告对行政当局目前对伊拉克政策的几乎每一个方面都提出了严厉批评,并敦促立即改变方向。',
  'transcription': '该 报 告 对 行 政 当 局 目 前 对 伊 拉 克 政 策 的 几 乎 每 一 个 方 面 都 提 出 了 严 厉 批 评 并 敦 促 立 即 改 变 方 向',
  '_': '该 | 报 | 告 | 对 | 行 | 政 | 当 | 局 | 目 | 前 | 对 | 伊 | 拉 | 克 | 政 | 策 | 的 | 几 | 乎 | 每 | 一 | 个 | 方 | 面 | 都 | 提 | 出 | 了 | 严 | 厉 | 批 | 评 | 并 | 敦 | 促 | 立 | 即 | 改 | 变 | 方 | 向 |',
  'num_samples': 200640,
  'gender': 'MALE'},
 {'id': 1667,
  'file_name': '206679170921238609.wav',
  'raw_transcription': '一般来说,当管理者开始领导过去的同事时,会出现两种行为。一种情况是,他们会努力与团队成员保持“亲密关系”。',
  'transcription': '一 般 来 说 当 管 理 者 开 始 领 导 过 去 的 同 事 时 会 出 现 两 种 行 为 一 种 情 况 是 他 们 会 努 力 与 团 队 成 员 保 持 亲 密 关 系',
  '_': '一 | 般 | 来 | 说 | 当 | 管 | 理 | 者 | 开 | 始 | 领 | 导 | 过 | 去 | 的 | 同 | 事 | 时 | 会 | 出 | 现 | 两 | 种 | 行 | 为 | 一 | 种 | 情 | 况 | 是 | 他 | 们 | 会 | 努 | 力 | 与 | 团 | 队 | 成 | 员 | 保 | 持 | 亲 | 密 | 关 | 系 |',
  'num_samples': 174720,
  'gender': 'FEMALE'},
 {'id': 1667,
  'file_name': '18066249635479552429.wav',
  'raw_transcription': '一般来说,当管理者开始领导过去的同事时,会出现两种行为。一种情况是,他们会努力与团队成员保持“亲密关系”。',
  'transcription': '一 般 来 说 当 管 理 者 开 始 领 导 过 去 的 同 事 时 会 出 现 两 种 行 为 一 种 情 况 是 他 们 会 努 力 与 团 队 成 员 保 持 亲 密 关 系',
  '_': '一 | 般 | 来 | 说 | 当 | 管 | 理 | 者 | 开 | 始 | 领 | 导 | 过 | 去 | 的 | 同 | 事 | 时 | 会 | 出 | 现 | 两 | 种 | 行 | 为 | 一 | 种 | 情 | 况 | 是 | 他 | 们 | 会 | 努 | 力 | 与 | 团 | 队 | 成 | 员 | 保 | 持 | 亲 | 密 | 关 | 系 |',
  'num_samples': 250240,
  'gender': 'MALE'},
 {'id': 1667,
  'file_name': '7118855371224214736.wav',
  'raw_transcription': '一般来说,当管理者开始领导过去的同事时,会出现两种行为。一种情况是,他们会努力与团队成员保持“亲密关系”。',
  'transcription': '一 般 来 说 当 管 理 者 开 始 领 导 过 去 的 同 事 时 会 出 现 两 种 行 为 一 种 情 况 是 他 们 会 努 力 与 团 队 成 员 保 持 亲 密 关 系',
  '_': '一 | 般 | 来 | 说 | 当 | 管 | 理 | 者 | 开 | 始 | 领 | 导 | 过 | 去 | 的 | 同 | 事 | 时 | 会 | 出 | 现 | 两 | 种 | 行 | 为 | 一 | 种 | 情 | 况 | 是 | 他 | 们 | 会 | 努 | 力 | 与 | 团 | 队 | 成 | 员 | 保 | 持 | 亲 | 密 | 关 | 系 |',
  'num_samples': 199680,
  'gender': 'MALE'},
 {'id': 1785,
  'file_name': '3657855762485154166.wav',
  'raw_transcription': '支架式教学不是一种学习方法,而是一种辅助刚学习使用新电脑程序或启动新项目的人的手段。',
  'transcription': '支 架 式 教 学 不 是 一 种 学 习 方 法 而 是 一 种 辅 助 刚 学 习 使 用 新 电 脑 程 序 或 启 动 新 项 目 的 人 的 手 段',
  '_': '支 | 架 | 式 | 教 | 学 | 不 | 是 | 一 | 种 | 学 | 习 | 方 | 法 | 而 | 是 | 一 | 种 | 辅 | 助 | 刚 | 学 | 习 | 使 | 用 | 新 | 电 | 脑 | 程 | 序 | 或 | 启 | 动 | 新 | 项 | 目 | 的 | 人 | 的 | 手 | 段 |',
  'num_samples': 156480,
  'gender': 'FEMALE'},
 {'id': 1785,
  'file_name': '10952847248994110499.wav',
  'raw_transcription': '支架式教学不是一种学习方法,而是一种辅助刚学习使用新电脑程序或启动新项目的人的手段。',
  'transcription': '支 架 式 教 学 不 是 一 种 学 习 方 法 而 是 一 种 辅 助 刚 学 习 使 用 新 电 脑 程 序 或 启 动 新 项 目 的 人 的 手 段',
  '_': '支 | 架 | 式 | 教 | 学 | 不 | 是 | 一 | 种 | 学 | 习 | 方 | 法 | 而 | 是 | 一 | 种 | 辅 | 助 | 刚 | 学 | 习 | 使 | 用 | 新 | 电 | 脑 | 程 | 序 | 或 | 启 | 动 | 新 | 项 | 目 | 的 | 人 | 的 | 手 | 段 |',
  'num_samples': 192960,
  'gender': 'MALE'},
 {'id': 1785,
  'file_name': '5834861906248187654.wav',
  'raw_transcription': '支架式教学不是一种学习方法,而是一种辅助刚学习使用新电脑程序或启动新项目的人的手段。',
  'transcription': '支 架 式 教 学 不 是 一 种 学 习 方 法 而 是 一 种 辅 助 刚 学 习 使 用 新 电 脑 程 序 或 启 动 新 项 目 的 人 的 手 段',
  '_': '支 | 架 | 式 | 教 | 学 | 不 | 是 | 一 | 种 | 学 | 习 | 方 | 法 | 而 | 是 | 一 | 种 | 辅 | 助 | 刚 | 学 | 习 | 使 | 用 | 新 | 电 | 脑 | 程 | 序 | 或 | 启 | 动 | 新 | 项 | 目 | 的 | 人 | 的 | 手 | 段 |',
  'num_samples': 270080,
  'gender': 'MALE'},
 {'id': 1988,
  'file_name': '12702637831364597982.wav',
  'raw_transcription': '在 20 世纪 20 年代,大多市民的主流态度是和平主义的、分离主义的。',
  'transcription': '在 20 世 纪 20 年 代 大 多 市 民 的 主 流 态 度 是 和 平 主 义 的 分 离 主 义 的',
  '_': '在 | 2 0 | 世 | 纪 | 2 0 | 年 | 代 | 大 | 多 | 市 | 民 | 的 | 主 | 流 | 态 | 度 | 是 | 和 | 平 | 主 | 义 | 的 | 分 | 离 | 主 | 义 | 的 |',
  'num_samples': 140160,
  'gender': 'MALE'},
 {'id': 1988,
  'file_name': '3344315741210503938.wav',
  'raw_transcription': '在 20 世纪 20 年代,大多市民的主流态度是和平主义的、分离主义的。',
  'transcription': '在 20 世 纪 20 年 代 大 多 市 民 的 主 流 态 度 是 和 平 主 义 的 分 离 主 义 的',
  '_': '在 | 2 0 | 世 | 纪 | 2 0 | 年 | 代 | 大 | 多 | 市 | 民 | 的 | 主 | 流 | 态 | 度 | 是 | 和 | 平 | 主 | 义 | 的 | 分 | 离 | 主 | 义 | 的 |',
  'num_samples': 132480,
  'gender': 'MALE'},
 {'id': 1988,
  'file_name': '7675792284677459297.wav',
  'raw_transcription': '在 20 世纪 20 年代,大多市民的主流态度是和平主义的、分离主义的。',
  'transcription': '在 20 世 纪 20 年 代 大 多 市 民 的 主 流 态 度 是 和 平 主 义 的 分 离 主 义 的',
  '_': '在 | 2 0 | 世 | 纪 | 2 0 | 年 | 代 | 大 | 多 | 市 | 民 | 的 | 主 | 流 | 态 | 度 | 是 | 和 | 平 | 主 | 义 | 的 | 分 | 离 | 主 | 义 | 的 |',
  'num_samples': 144320,
  'gender': 'MALE'},
 {'id': 1864,
  'file_name': '15179165224739543387.wav',
  'raw_transcription': '基什内尔女士在阿根廷大剧院宣布她有意参加总统竞选,2005 年也是在这里,她作为布宜诺斯艾利斯省代表开始竞选参议员。',
  'transcription': '基 什 内 尔 女 士 在 阿 根 廷 大 剧 院 宣 布 她 有 意 参 加 总 统 竞 选 2005 年 也 是 在 这 里 她 作 为 布 宜 诺 斯 艾 利 斯 省 代 表 开 始 竞 选 参 议 员',
  '_': '基 | 什 | 内 | 尔 | 女 | 士 | 在 | 阿 | 根 | 廷 | 大 | 剧 | 院 | 宣 | 布 | 她 | 有 | 意 | 参 | 加 | 总 | 统 | 竞 | 选 | 2 0 0 5 | 年 | 也 | 是 | 在 | 这 | 里 | 她 | 作 | 为 | 布 | 宜 | 诺 | 斯 | 艾 | 利 | 斯 | 省 | 代 | 表 | 开 | 始 | 竞 | 选 | 参 | 议 | 员 |',
  'num_samples': 197760,
  'gender': 'FEMALE'},
 {'id': 1864,
  'file_name': '5836857491995956152.wav',
  'raw_transcription': '基什内尔女士在阿根廷大剧院宣布她有意参加总统竞选,2005 年也是在这里,她作为布宜诺斯艾利斯省代表开始竞选参议员。',
  'transcription': '基 什 内 尔 女 士 在 阿 根 廷 大 剧 院 宣 布 她 有 意 参 加 总 统 竞 选 2005 年 也 是 在 这 里 她 作 为 布 宜 诺 斯 艾 利 斯 省 代 表 开 始 竞 选 参 议 员',
  '_': '基 | 什 | 内 | 尔 | 女 | 士 | 在 | 阿 | 根 | 廷 | 大 | 剧 | 院 | 宣 | 布 | 她 | 有 | 意 | 参 | 加 | 总 | 统 | 竞 | 选 | 2 0 0 5 | 年 | 也 | 是 | 在 | 这 | 里 | 她 | 作 | 为 | 布 | 宜 | 诺 | 斯 | 艾 | 利 | 斯 | 省 | 代 | 表 | 开 | 始 | 竞 | 选 | 参 | 议 | 员 |',
  'num_samples': 260160,
  'gender': 'MALE'},
 {'id': 1864,
  'file_name': '5852004225670037813.wav',
  'raw_transcription': '基什内尔女士在阿根廷大剧院宣布她有意参加总统竞选,2005 年也是在这里,她作为布宜诺斯艾利斯省代表开始竞选参议员。',
  'transcription': '基 什 内 尔 女 士 在 阿 根 廷 大 剧 院 宣 布 她 有 意 参 加 总 统 竞 选 2005 年 也 是 在 这 里 她 作 为 布 宜 诺 斯 艾 利 斯 省 代 表 开 始 竞 选 参 议 员',
  '_': '基 | 什 | 内 | 尔 | 女 | 士 | 在 | 阿 | 根 | 廷 | 大 | 剧 | 院 | 宣 | 布 | 她 | 有 | 意 | 参 | 加 | 总 | 统 | 竞 | 选 | 2 0 0 5 | 年 | 也 | 是 | 在 | 这 | 里 | 她 | 作 | 为 | 布 | 宜 | 诺 | 斯 | 艾 | 利 | 斯 | 省 | 代 | 表 | 开 | 始 | 竞 | 选 | 参 | 议 | 员 |',
  'num_samples': 206400,
  'gender': 'FEMALE'},
 {'id': 1704,
  'file_name': '11379309135940252576.wav',
  'raw_transcription': '1990 年,由于沙漠的威胁,它被列入了濒危世界遗产名录。',
  'transcription': '1990 年 由 于 沙 漠 的 威 胁 它 被 列 入 了 濒 危 世 界 遗 产 名 录',
  '_': '1 9 9 0 | 年 | 由 | 于 | 沙 | 漠 | 的 | 威 | 胁 | 它 | 被 | 列 | 入 | 了 | 濒 | 危 | 世 | 界 | 遗 | 产 | 名 | 录 |',
  'num_samples': 140160,
  'gender': 'MALE'},
 {'id': 1704,
  'file_name': '9419339540596839145.wav',
  'raw_transcription': '1990 年,由于沙漠的威胁,它被列入了濒危世界遗产名录。',
  'transcription': '1990 年 由 于 沙 漠 的 威 胁 它 被 列 入 了 濒 危 世 界 遗 产 名 录',
  '_': '1 9 9 0 | 年 | 由 | 于 | 沙 | 漠 | 的 | 威 | 胁 | 它 | 被 | 列 | 入 | 了 | 濒 | 危 | 世 | 界 | 遗 | 产 | 名 | 录 |',
  'num_samples': 94080,
  'gender': 'FEMALE'},
 {'id': 1704,
  'file_name': '11044189448827036819.wav',
  'raw_transcription': '1990 年,由于沙漠的威胁,它被列入了濒危世界遗产名录。',
  'transcription': '1990 年 由 于 沙 漠 的 威 胁 它 被 列 入 了 濒 危 世 界 遗 产 名 录',
  '_': '1 9 9 0 | 年 | 由 | 于 | 沙 | 漠 | 的 | 威 | 胁 | 它 | 被 | 列 | 入 | 了 | 濒 | 危 | 世 | 界 | 遗 | 产 | 名 | 录 |',
  'num_samples': 116160,
  'gender': 'FEMALE'},
 {'id': 1696,
  'file_name': '4977600098624265441.wav',
  'raw_transcription': '该大学的研究人员表示,这两种化合物相互作用形成的晶体可能会造成肾脏功能障碍。',
  'transcription': '该 大 学 的 研 究 人 员 表 示 这 两 种 化 合 物 相 互 作 用 形 成 的 晶 体 可 能 会 造 成 肾 脏 功 能 障 碍',
  '_': '该 | 大 | 学 | 的 | 研 | 究 | 人 | 员 | 表 | 示 | 这 | 两 | 种 | 化 | 合 | 物 | 相 | 互 | 作 | 用 | 形 | 成 | 的 | 晶 | 体 | 可 | 能 | 会 | 造 | 成 | 肾 | 脏 | 功 | 能 | 障 | 碍 |',
  'num_samples': 183360,
  'gender': 'MALE'},
 {'id': 1696,
  'file_name': '1146692660489015515.wav',
  'raw_transcription': '该大学的研究人员表示,这两种化合物相互作用形成的晶体可能会造成肾脏功能障碍。',
  'transcription': '该 大 学 的 研 究 人 员 表 示 这 两 种 化 合 物 相 互 作 用 形 成 的 晶 体 可 能 会 造 成 肾 脏 功 能 障 碍',
  '_': '该 | 大 | 学 | 的 | 研 | 究 | 人 | 员 | 表 | 示 | 这 | 两 | 种 | 化 | 合 | 物 | 相 | 互 | 作 | 用 | 形 | 成 | 的 | 晶 | 体 | 可 | 能 | 会 | 造 | 成 | 肾 | 脏 | 功 | 能 | 障 | 碍 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1696,
  'file_name': '12448583632898281923.wav',
  'raw_transcription': '该大学的研究人员表示,这两种化合物相互作用形成的晶体可能会造成肾脏功能障碍。',
  'transcription': '该 大 学 的 研 究 人 员 表 示 这 两 种 化 合 物 相 互 作 用 形 成 的 晶 体 可 能 会 造 成 肾 脏 功 能 障 碍',
  '_': '该 | 大 | 学 | 的 | 研 | 究 | 人 | 员 | 表 | 示 | 这 | 两 | 种 | 化 | 合 | 物 | 相 | 互 | 作 | 用 | 形 | 成 | 的 | 晶 | 体 | 可 | 能 | 会 | 造 | 成 | 肾 | 脏 | 功 | 能 | 障 | 碍 |',
  'num_samples': 157440,
  'gender': 'MALE'},
 {'id': 1800,
  'file_name': '6484078875722223530.wav',
  'raw_transcription': '大桥预计将于 2017 年 9 月全面投入使用,届时巴西海关检查站预计也将完工。',
  'transcription': '大 桥 预 计 将 于 2017 年 9 月 全 面 投 入 使 用 届 时 巴 西 海 关 检 查 站 预 计 也 将 完 工',
  '_': '大 | 桥 | 预 | 计 | 将 | 于 | 2 0 1 7 | 年 | 9 | 月 | 全 | 面 | 投 | 入 | 使 | 用 | 届 | 时 | 巴 | 西 | 海 | 关 | 检 | 查 | 站 | 预 | 计 | 也 | 将 | 完 | 工 |',
  'num_samples': 135360,
  'gender': 'FEMALE'},
 {'id': 1800,
  'file_name': '7047901157411502722.wav',
  'raw_transcription': '大桥预计将于 2017 年 9 月全面投入使用,届时巴西海关检查站预计也将完工。',
  'transcription': '大 桥 预 计 将 于 2017 年 9 月 全 面 投 入 使 用 届 时 巴 西 海 关 检 查 站 预 计 也 将 完 工',
  '_': '大 | 桥 | 预 | 计 | 将 | 于 | 2 0 1 7 | 年 | 9 | 月 | 全 | 面 | 投 | 入 | 使 | 用 | 届 | 时 | 巴 | 西 | 海 | 关 | 检 | 查 | 站 | 预 | 计 | 也 | 将 | 完 | 工 |',
  'num_samples': 176640,
  'gender': 'MALE'},
 {'id': 1800,
  'file_name': '18328957478976177578.wav',
  'raw_transcription': '大桥预计将于 2017 年 9 月全面投入使用,届时巴西海关检查站预计也将完工。',
  'transcription': '大 桥 预 计 将 于 2017 年 9 月 全 面 投 入 使 用 届 时 巴 西 海 关 检 查 站 预 计 也 将 完 工',
  '_': '大 | 桥 | 预 | 计 | 将 | 于 | 2 0 1 7 | 年 | 9 | 月 | 全 | 面 | 投 | 入 | 使 | 用 | 届 | 时 | 巴 | 西 | 海 | 关 | 检 | 查 | 站 | 预 | 计 | 也 | 将 | 完 | 工 |',
  'num_samples': 130560,
  'gender': 'FEMALE'},
 {'id': 1977,
  'file_name': '11127960830093749545.wav',
  'raw_transcription': '狮群由一到三只有亲属关系的成年雄性,以及可多达三十只的雌性和幼崽组成。',
  'transcription': '狮 群 由 一 到 三 只 有 亲 属 关 系 的 成 年 雄 性 以 及 可 多 达 三 十 只 的 雌 性 和 幼 崽 组 成',
  '_': '狮 | 群 | 由 | 一 | 到 | 三 | 只 | 有 | 亲 | 属 | 关 | 系 | 的 | 成 | 年 | 雄 | 性 | 以 | 及 | 可 | 多 | 达 | 三 | 十 | 只 | 的 | 雌 | 性 | 和 | 幼 | 崽 | 组 | 成 |',
  'num_samples': 199680,
  'gender': 'MALE'},
 {'id': 1977,
  'file_name': '12295497910930440808.wav',
  'raw_transcription': '狮群由一到三只有亲属关系的成年雄性,以及可多达三十只的雌性和幼崽组成。',
  'transcription': '狮 群 由 一 到 三 只 有 亲 属 关 系 的 成 年 雄 性 以 及 可 多 达 三 十 只 的 雌 性 和 幼 崽 组 成',
  '_': '狮 | 群 | 由 | 一 | 到 | 三 | 只 | 有 | 亲 | 属 | 关 | 系 | 的 | 成 | 年 | 雄 | 性 | 以 | 及 | 可 | 多 | 达 | 三 | 十 | 只 | 的 | 雌 | 性 | 和 | 幼 | 崽 | 组 | 成 |',
  'num_samples': 257920,
  'gender': 'MALE'},
 {'id': 1766,
  'file_name': '6155642579709908820.wav',
  'raw_transcription': '有些原子含有不稳定的原子核,这意味着它们很可能会在很少或没有刺激的情况下发生分裂。',
  'transcription': '有 些 原 子 含 有 不 稳 定 的 原 子 核 这 意 味 着 它 们 很 可 能 会 在 很 少 或 没 有 刺 激 的 情 况 下 发 生 分 裂',
  '_': '有 | 些 | 原 | 子 | 含 | 有 | 不 | 稳 | 定 | 的 | 原 | 子 | 核 | 这 | 意 | 味 | 着 | 它 | 们 | 很 | 可 | 能 | 会 | 在 | 很 | 少 | 或 | 没 | 有 | 刺 | 激 | 的 | 情 | 况 | 下 | 发 | 生 | 分 | 裂 |',
  'num_samples': 167040,
  'gender': 'MALE'},
 {'id': 1766,
  'file_name': '16358088028520791764.wav',
  'raw_transcription': '有些原子含有不稳定的原子核,这意味着它们很可能会在很少或没有刺激的情况下发生分裂。',
  'transcription': '有 些 原 子 含 有 不 稳 定 的 原 子 核 这 意 味 着 它 们 很 可 能 会 在 很 少 或 没 有 刺 激 的 情 况 下 发 生 分 裂',
  '_': '有 | 些 | 原 | 子 | 含 | 有 | 不 | 稳 | 定 | 的 | 原 | 子 | 核 | 这 | 意 | 味 | 着 | 它 | 们 | 很 | 可 | 能 | 会 | 在 | 很 | 少 | 或 | 没 | 有 | 刺 | 激 | 的 | 情 | 况 | 下 | 发 | 生 | 分 | 裂 |',
  'num_samples': 151680,
  'gender': 'MALE'},
 {'id': 1766,
  'file_name': '4664354586828009439.wav',
  'raw_transcription': '有些原子含有不稳定的原子核,这意味着它们很可能会在很少或没有刺激的情况下发生分裂。',
  'transcription': '有 些 原 子 含 有 不 稳 定 的 原 子 核 这 意 味 着 它 们 很 可 能 会 在 很 少 或 没 有 刺 激 的 情 况 下 发 生 分 裂',
  '_': '有 | 些 | 原 | 子 | 含 | 有 | 不 | 稳 | 定 | 的 | 原 | 子 | 核 | 这 | 意 | 味 | 着 | 它 | 们 | 很 | 可 | 能 | 会 | 在 | 很 | 少 | 或 | 没 | 有 | 刺 | 激 | 的 | 情 | 况 | 下 | 发 | 生 | 分 | 裂 |',
  'num_samples': 159360,
  'gender': 'MALE'},
 {'id': 1726,
  'file_name': '11663875758188666245.wav',
  'raw_transcription': '实地考察是任何教学活动的重要组成部分。通常,老师会很乐意带学生去那些公交车无法到达的地方。',
  'transcription': '实 地 考 察 是 任 何 教 学 活 动 的 重 要 组 成 部 分 通 常 老 师 会 很 乐 意 带 学 生 去 那 些 公 交 车 无 法 到 达 的 地 方',
  '_': '实 | 地 | 考 | 察 | 是 | 任 | 何 | 教 | 学 | 活 | 动 | 的 | 重 | 要 | 组 | 成 | 部 | 分 | 通 | 常 | 老 | 师 | 会 | 很 | 乐 | 意 | 带 | 学 | 生 | 去 | 那 | 些 | 公 | 交 | 车 | 无 | 法 | 到 | 达 | 的 | 地 | 方 |',
  'num_samples': 211200,
  'gender': 'MALE'},
 {'id': 1726,
  'file_name': '17355760800865622713.wav',
  'raw_transcription': '实地考察是任何教学活动的重要组成部分。通常,老师会很乐意带学生去那些公交车无法到达的地方。',
  'transcription': '实 地 考 察 是 任 何 教 学 活 动 的 重 要 组 成 部 分 通 常 老 师 会 很 乐 意 带 学 生 去 那 些 公 交 车 无 法 到 达 的 地 方',
  '_': '实 | 地 | 考 | 察 | 是 | 任 | 何 | 教 | 学 | 活 | 动 | 的 | 重 | 要 | 组 | 成 | 部 | 分 | 通 | 常 | 老 | 师 | 会 | 很 | 乐 | 意 | 带 | 学 | 生 | 去 | 那 | 些 | 公 | 交 | 车 | 无 | 法 | 到 | 达 | 的 | 地 | 方 |',
  'num_samples': 170880,
  'gender': 'MALE'},
 {'id': 1726,
  'file_name': '15699015126903156742.wav',
  'raw_transcription': '实地考察是任何教学活动的重要组成部分。通常,老师会很乐意带学生去那些公交车无法到达的地方。',
  'transcription': '实 地 考 察 是 任 何 教 学 活 动 的 重 要 组 成 部 分 通 常 老 师 会 很 乐 意 带 学 生 去 那 些 公 交 车 无 法 到 达 的 地 方',
  '_': '实 | 地 | 考 | 察 | 是 | 任 | 何 | 教 | 学 | 活 | 动 | 的 | 重 | 要 | 组 | 成 | 部 | 分 | 通 | 常 | 老 | 师 | 会 | 很 | 乐 | 意 | 带 | 学 | 生 | 去 | 那 | 些 | 公 | 交 | 车 | 无 | 法 | 到 | 达 | 的 | 地 | 方 |',
  'num_samples': 144000,
  'gender': 'FEMALE'},
 {'id': 1964,
  'file_name': '12412862873460570290.wav',
  'raw_transcription': '尚存的 25 份当列普单面印刷版( Dunlap broadsides)是该文件现存最早的版本。手写原稿未能保留下来。',
  'transcription': '尚 存 的 25 份 当 列 普 单 面 印 刷 版 dunlap broadsides 是 该 文 件 现 存 最 早 的 版 本 手 写 原 稿 未 能 保 留 下 来',
  '_': '尚 | 存 | 的 | 2 5 | 份 | 当 | 列 | 普 | 单 | 面 | 印 | 刷 | 版 | d u n l a p | b r o a d s i d e s | 是 | 该 | 文 | 件 | 现 | 存 | 最 | 早 | 的 | 版 | 本 | 手 | 写 | 原 | 稿 | 未 | 能 | 保 | 留 | 下 | 来 |',
  'num_samples': 217920,
  'gender': 'MALE'},
 {'id': 1964,
  'file_name': '16310192676441656017.wav',
  'raw_transcription': '尚存的 25 份当列普单面印刷版( Dunlap broadsides)是该文件现存最早的版本。手写原稿未能保留下来。',
  'transcription': '尚 存 的 25 份 当 列 普 单 面 印 刷 版 dunlap broadsides 是 该 文 件 现 存 最 早 的 版 本 手 写 原 稿 未 能 保 留 下 来',
  '_': '尚 | 存 | 的 | 2 5 | 份 | 当 | 列 | 普 | 单 | 面 | 印 | 刷 | 版 | d u n l a p | b r o a d s i d e s | 是 | 该 | 文 | 件 | 现 | 存 | 最 | 早 | 的 | 版 | 本 | 手 | 写 | 原 | 稿 | 未 | 能 | 保 | 留 | 下 | 来 |',
  'num_samples': 181440,
  'gender': 'MALE'},
 {'id': 1954,
  'file_name': '5239400653493044838.wav',
  'raw_transcription': '他们因其严格防守、控球技术和出色的团队合作脱颖而出。很显然,这是一支无往不胜的球队。',
  'transcription': '他 们 因 其 严 格 防 守 控 球 技 术 和 出 色 的 团 队 合 作 脱 颖 而 出 很 显 然 这 是 一 支 无 往 不 胜 的 球 队',
  '_': '他 | 们 | 因 | 其 | 严 | 格 | 防 | 守 | 控 | 球 | 技 | 术 | 和 | 出 | 色 | 的 | 团 | 队 | 合 | 作 | 脱 | 颖 | 而 | 出 | 很 | 显 | 然 | 这 | 是 | 一 | 支 | 无 | 往 | 不 | 胜 | 的 | 球 | 队 |',
  'num_samples': 191040,
  'gender': 'MALE'},
 {'id': 1954,
  'file_name': '14413479769404247780.wav',
  'raw_transcription': '他们因其严格防守、控球技术和出色的团队合作脱颖而出。很显然,这是一支无往不胜的球队。',
  'transcription': '他 们 因 其 严 格 防 守 控 球 技 术 和 出 色 的 团 队 合 作 脱 颖 而 出 很 显 然 这 是 一 支 无 往 不 胜 的 球 队',
  '_': '他 | 们 | 因 | 其 | 严 | 格 | 防 | 守 | 控 | 球 | 技 | 术 | 和 | 出 | 色 | 的 | 团 | 队 | 合 | 作 | 脱 | 颖 | 而 | 出 | 很 | 显 | 然 | 这 | 是 | 一 | 支 | 无 | 往 | 不 | 胜 | 的 | 球 | 队 |',
  'num_samples': 155520,
  'gender': 'FEMALE'},
 {'id': 1954,
  'file_name': '12229686411188272719.wav',
  'raw_transcription': '他们因其严格防守、控球技术和出色的团队合作脱颖而出。很显然,这是一支无往不胜的球队。',
  'transcription': '他 们 因 其 严 格 防 守 控 球 技 术 和 出 色 的 团 队 合 作 脱 颖 而 出 很 显 然 这 是 一 支 无 往 不 胜 的 球 队',
  '_': '他 | 们 | 因 | 其 | 严 | 格 | 防 | 守 | 控 | 球 | 技 | 术 | 和 | 出 | 色 | 的 | 团 | 队 | 合 | 作 | 脱 | 颖 | 而 | 出 | 很 | 显 | 然 | 这 | 是 | 一 | 支 | 无 | 往 | 不 | 胜 | 的 | 球 | 队 |',
  'num_samples': 179520,
  'gender': 'MALE'},
 {'id': 1759,
  'file_name': '5962326943674921180.wav',
  'raw_transcription': '29 岁的 Malar Balasubramanian 医生在俄亥俄州辛辛那提市以北约 15 英里的郊区布鲁艾施被发现,她被找到时身穿 T 恤衫和内裤,躺在路边的地上,看上去服用了大量药物。',
  'transcription': '29 岁 的 malar balasubramanian 医 生 在 俄 亥 俄 州 辛 辛 那 提 市 以 北 约 15 英 里 的 郊 区 布 鲁 艾 施 被 发 现 她 被 找 到 时 身 穿 t 恤 衫 和 内 裤 躺 在 路 边 的 地 上 看 上 去 服 用 了 大 量 药 物',
  '_': '2 9 | 岁 | 的 | m a l a r | b a l a s u b r a m a n i a n | 医 | 生 | 在 | 俄 | 亥 | 俄 | 州 | 辛 | 辛 | 那 | 提 | 市 | 以 | 北 | 约 | 1 5 | 英 | 里 | 的 | 郊 | 区 | 布 | 鲁 | 艾 | 施 | 被 | 发 | 现 | 她 | 被 | 找 | 到 | 时 | 身 | 穿 | t | 恤 | 衫 | 和 | 内 | 裤 | 躺 | 在 | 路 | 边 | 的 | 地 | 上 | 看 | 上 | 去 | 服 | 用 | 了 | 大 | 量 | 药 | 物 |',
  'num_samples': 400320,
  'gender': 'MALE'},
 {'id': 1759,
  'file_name': '4719524538529342597.wav',
  'raw_transcription': '29 岁的 Malar Balasubramanian 医生在俄亥俄州辛辛那提市以北约 15 英里的郊区布鲁艾施被发现,她被找到时身穿 T 恤衫和内裤,躺在路边的地上,看上去服用了大量药物。',
  'transcription': '29 岁 的 malar balasubramanian 医 生 在 俄 亥 俄 州 辛 辛 那 提 市 以 北 约 15 英 里 的 郊 区 布 鲁 艾 施 被 发 现 她 被 找 到 时 身 穿 t 恤 衫 和 内 裤 躺 在 路 边 的 地 上 看 上 去 服 用 了 大 量 药 物',
  '_': '2 9 | 岁 | 的 | m a l a r | b a l a s u b r a m a n i a n | 医 | 生 | 在 | 俄 | 亥 | 俄 | 州 | 辛 | 辛 | 那 | 提 | 市 | 以 | 北 | 约 | 1 5 | 英 | 里 | 的 | 郊 | 区 | 布 | 鲁 | 艾 | 施 | 被 | 发 | 现 | 她 | 被 | 找 | 到 | 时 | 身 | 穿 | t | 恤 | 衫 | 和 | 内 | 裤 | 躺 | 在 | 路 | 边 | 的 | 地 | 上 | 看 | 上 | 去 | 服 | 用 | 了 | 大 | 量 | 药 | 物 |',
  'num_samples': 266880,
  'gender': 'FEMALE'},
 {'id': 1839,
  'file_name': '1616036760280829004.wav',
  'raw_transcription': '把滑雪路线想象成类似的徒步路线。',
  'transcription': '把 滑 雪 路 线 想 象 成 类 似 的 徒 步 路 线',
  '_': '把 | 滑 | 雪 | 路 | 线 | 想 | 象 | 成 | 类 | 似 | 的 | 徒 | 步 | 路 | 线 |',
  'num_samples': 99840,
  'gender': 'MALE'},
 {'id': 1839,
  'file_name': '2576407373986904835.wav',
  'raw_transcription': '把滑雪路线想象成类似的徒步路线。',
  'transcription': '把 滑 雪 路 线 想 象 成 类 似 的 徒 步 路 线',
  '_': '把 | 滑 | 雪 | 路 | 线 | 想 | 象 | 成 | 类 | 似 | 的 | 徒 | 步 | 路 | 线 |',
  'num_samples': 116160,
  'gender': 'MALE'},
 {'id': 1839,
  'file_name': '16579409266307598139.wav',
  'raw_transcription': '把滑雪路线想象成类似的徒步路线。',
  'transcription': '把 滑 雪 路 线 想 象 成 类 似 的 徒 步 路 线',
  '_': '把 | 滑 | 雪 | 路 | 线 | 想 | 象 | 成 | 类 | 似 | 的 | 徒 | 步 | 路 | 线 |',
  'num_samples': 118080,
  'gender': 'MALE'},
 {'id': 1674,
  'file_name': '15619666715819820695.wav',
  'raw_transcription': '在某些地区,水煮一分钟就足够了,在其他地区则需要几分钟的时间。',
  'transcription': '在 某 些 地 区 水 煮 一 分 钟 就 足 够 了 在 其 他 地 区 则 需 要 几 分 钟 的 时 间',
  '_': '在 | 某 | 些 | 地 | 区 | 水 | 煮 | 一 | 分 | 钟 | 就 | 足 | 够 | 了 | 在 | 其 | 他 | 地 | 区 | 则 | 需 | 要 | 几 | 分 | 钟 | 的 | 时 | 间 |',
  'num_samples': 142080,
  'gender': 'MALE'},
 {'id': 1674,
  'file_name': '7533369920676653732.wav',
  'raw_transcription': '在某些地区,水煮一分钟就足够了,在其他地区则需要几分钟的时间。',
  'transcription': '在 某 些 地 区 水 煮 一 分 钟 就 足 够 了 在 其 他 地 区 则 需 要 几 分 钟 的 时 间',
  '_': '在 | 某 | 些 | 地 | 区 | 水 | 煮 | 一 | 分 | 钟 | 就 | 足 | 够 | 了 | 在 | 其 | 他 | 地 | 区 | 则 | 需 | 要 | 几 | 分 | 钟 | 的 | 时 | 间 |',
  'num_samples': 155520,
  'gender': 'MALE'},
 {'id': 1674,
  'file_name': '4518873800093805764.wav',
  'raw_transcription': '在某些地区,水煮一分钟就足够了,在其他地区则需要几分钟的时间。',
  'transcription': '在 某 些 地 区 水 煮 一 分 钟 就 足 够 了 在 其 他 地 区 则 需 要 几 分 钟 的 时 间',
  '_': '在 | 某 | 些 | 地 | 区 | 水 | 煮 | 一 | 分 | 钟 | 就 | 足 | 够 | 了 | 在 | 其 | 他 | 地 | 区 | 则 | 需 | 要 | 几 | 分 | 钟 | 的 | 时 | 间 |',
  'num_samples': 255360,
  'gender': 'MALE'},
 {'id': 1701,
  'file_name': '1928563664387972633.wav',
  'raw_transcription': '山羊似乎是 1 万年前左右在伊朗的扎格罗斯山脉首次被驯养的。',
  'transcription': '山 羊 似 乎 是 1 万 年 前 左 右 在 伊 朗 的 扎 格 罗 斯 山 脉 首 次 被 驯 养 的',
  '_': '山 | 羊 | 似 | 乎 | 是 | 1 | 万 | 年 | 前 | 左 | 右 | 在 | 伊 | 朗 | 的 | 扎 | 格 | 罗 | 斯 | 山 | 脉 | 首 | 次 | 被 | 驯 | 养 | 的 |',
  'num_samples': 230080,
  'gender': 'MALE'},
 {'id': 1701,
  'file_name': '16741635656747751013.wav',
  'raw_transcription': '山羊似乎是 1 万年前左右在伊朗的扎格罗斯山脉首次被驯养的。',
  'transcription': '山 羊 似 乎 是 1 万 年 前 左 右 在 伊 朗 的 扎 格 罗 斯 山 脉 首 次 被 驯 养 的',
  '_': '山 | 羊 | 似 | 乎 | 是 | 1 | 万 | 年 | 前 | 左 | 右 | 在 | 伊 | 朗 | 的 | 扎 | 格 | 罗 | 斯 | 山 | 脉 | 首 | 次 | 被 | 驯 | 养 | 的 |',
  'num_samples': 198080,
  'gender': 'MALE'},
 {'id': 1701,
  'file_name': '2149756127580187675.wav',
  'raw_transcription': '山羊似乎是 1 万年前左右在伊朗的扎格罗斯山脉首次被驯养的。',
  'transcription': '山 羊 似 乎 是 1 万 年 前 左 右 在 伊 朗 的 扎 格 罗 斯 山 脉 首 次 被 驯 养 的',
  '_': '山 | 羊 | 似 | 乎 | 是 | 1 | 万 | 年 | 前 | 左 | 右 | 在 | 伊 | 朗 | 的 | 扎 | 格 | 罗 | 斯 | 山 | 脉 | 首 | 次 | 被 | 驯 | 养 | 的 |',
  'num_samples': 208960,
  'gender': 'MALE'},
 {'id': 1884,
  'file_name': '191404423350255920.wav',
  'raw_transcription': '具体说来,据说可以通过正确解读微表情来判断一个人是否在撒谎。',
  'transcription': '具 体 说 来 据 说 可 以 通 过 正 确 解 读 微 表 情 来 判 断 一 个 人 是 否 在 撒 谎',
  '_': '具 | 体 | 说 | 来 | 据 | 说 | 可 | 以 | 通 | 过 | 正 | 确 | 解 | 读 | 微 | 表 | 情 | 来 | 判 | 断 | 一 | 个 | 人 | 是 | 否 | 在 | 撒 | 谎 |',
  'num_samples': 202240,
  'gender': 'MALE'},
 {'id': 1884,
  'file_name': '4113524872506500170.wav',
  'raw_transcription': '具体说来,据说可以通过正确解读微表情来判断一个人是否在撒谎。',
  'transcription': '具 体 说 来 据 说 可 以 通 过 正 确 解 读 微 表 情 来 判 断 一 个 人 是 否 在 撒 谎',
  '_': '具 | 体 | 说 | 来 | 据 | 说 | 可 | 以 | 通 | 过 | 正 | 确 | 解 | 读 | 微 | 表 | 情 | 来 | 判 | 断 | 一 | 个 | 人 | 是 | 否 | 在 | 撒 | 谎 |',
  'num_samples': 103680,
  'gender': 'FEMALE'},
 {'id': 1884,
  'file_name': '10400579561005332584.wav',
  'raw_transcription': '具体说来,据说可以通过正确解读微表情来判断一个人是否在撒谎。',
  'transcription': '具 体 说 来 据 说 可 以 通 过 正 确 解 读 微 表 情 来 判 断 一 个 人 是 否 在 撒 谎',
  '_': '具 | 体 | 说 | 来 | 据 | 说 | 可 | 以 | 通 | 过 | 正 | 确 | 解 | 读 | 微 | 表 | 情 | 来 | 判 | 断 | 一 | 个 | 人 | 是 | 否 | 在 | 撒 | 谎 |',
  'num_samples': 110400,
  'gender': 'FEMALE'},
 {'id': 1905,
  'file_name': '1461590807118917333.wav',
  'raw_transcription': '摩尔多瓦的首都是基希讷乌。当地语言是罗马尼亚语,但俄语也被广泛使用。',
  'transcription': '摩 尔 多 瓦 的 首 都 是 基 希 讷 乌 当 地 语 言 是 罗 马 尼 亚 语 但 俄 语 也 被 广 泛 使 用',
  '_': '摩 | 尔 | 多 | 瓦 | 的 | 首 | 都 | 是 | 基 | 希 | 讷 | 乌 | 当 | 地 | 语 | 言 | 是 | 罗 | 马 | 尼 | 亚 | 语 | 但 | 俄 | 语 | 也 | 被 | 广 | 泛 | 使 | 用 |',
  'num_samples': 121920,
  'gender': 'FEMALE'},
 {'id': 1905,
  'file_name': '10279011772105822622.wav',
  'raw_transcription': '摩尔多瓦的首都是基希讷乌。当地语言是罗马尼亚语,但俄语也被广泛使用。',
  'transcription': '摩 尔 多 瓦 的 首 都 是 基 希 讷 乌 当 地 语 言 是 罗 马 尼 亚 语 但 俄 语 也 被 广 泛 使 用',
  '_': '摩 | 尔 | 多 | 瓦 | 的 | 首 | 都 | 是 | 基 | 希 | 讷 | 乌 | 当 | 地 | 语 | 言 | 是 | 罗 | 马 | 尼 | 亚 | 语 | 但 | 俄 | 语 | 也 | 被 | 广 | 泛 | 使 | 用 |',
  'num_samples': 120960,
  'gender': 'FEMALE'},
 {'id': 1905,
  'file_name': '13169325977809206912.wav',
  'raw_transcription': '摩尔多瓦的首都是基希讷乌。当地语言是罗马尼亚语,但俄语也被广泛使用。',
  'transcription': '摩 尔 多 瓦 的 首 都 是 基 希 讷 乌 当 地 语 言 是 罗 马 尼 亚 语 但 俄 语 也 被 广 泛 使 用',
  '_': '摩 | 尔 | 多 | 瓦 | 的 | 首 | 都 | 是 | 基 | 希 | 讷 | 乌 | 当 | 地 | 语 | 言 | 是 | 罗 | 马 | 尼 | 亚 | 语 | 但 | 俄 | 语 | 也 | 被 | 广 | 泛 | 使 | 用 |',
  'num_samples': 168960,
  'gender': 'MALE'},
 {'id': 1990,
  'file_name': '4811445129937264006.wav',
  'raw_transcription': '博客还能帮助学生提高写作能力。尽管学生们开始写博客时,用的语法和拼写往往都很马虎,读者的出现通常会改变这一状况。',
  'transcription': '博 客 还 能 帮 助 学 生 提 高 写 作 能 力 尽 管 学 生 们 开 始 写 博 客 时 用 的 语 法 和 拼 写 往 往 都 很 马 虎 读 者 的 出 现 通 常 会 改 变 这 一 状 况',
  '_': '博 | 客 | 还 | 能 | 帮 | 助 | 学 | 生 | 提 | 高 | 写 | 作 | 能 | 力 | 尽 | 管 | 学 | 生 | 们 | 开 | 始 | 写 | 博 | 客 | 时 | 用 | 的 | 语 | 法 | 和 | 拼 | 写 | 往 | 往 | 都 | 很 | 马 | 虎 | 读 | 者 | 的 | 出 | 现 | 通 | 常 | 会 | 改 | 变 | 这 | 一 | 状 | 况 |',
  'num_samples': 178560,
  'gender': 'FEMALE'},
 {'id': 1990,
  'file_name': '7456646315383110636.wav',
  'raw_transcription': '博客还能帮助学生提高写作能力。尽管学生们开始写博客时,用的语法和拼写往往都很马虎,读者的出现通常会改变这一状况。',
  'transcription': '博 客 还 能 帮 助 学 生 提 高 写 作 能 力 尽 管 学 生 们 开 始 写 博 客 时 用 的 语 法 和 拼 写 往 往 都 很 马 虎 读 者 的 出 现 通 常 会 改 变 这 一 状 况',
  '_': '博 | 客 | 还 | 能 | 帮 | 助 | 学 | 生 | 提 | 高 | 写 | 作 | 能 | 力 | 尽 | 管 | 学 | 生 | 们 | 开 | 始 | 写 | 博 | 客 | 时 | 用 | 的 | 语 | 法 | 和 | 拼 | 写 | 往 | 往 | 都 | 很 | 马 | 虎 | 读 | 者 | 的 | 出 | 现 | 通 | 常 | 会 | 改 | 变 | 这 | 一 | 状 | 况 |',
  'num_samples': 161280,
  'gender': 'FEMALE'},
 {'id': 1990,
  'file_name': '4190733140658283235.wav',
  'raw_transcription': '博客还能帮助学生提高写作能力。尽管学生们开始写博客时,用的语法和拼写往往都很马虎,读者的出现通常会改变这一状况。',
  'transcription': '博 客 还 能 帮 助 学 生 提 高 写 作 能 力 尽 管 学 生 们 开 始 写 博 客 时 用 的 语 法 和 拼 写 往 往 都 很 马 虎 读 者 的 出 现 通 常 会 改 变 这 一 状 况',
  '_': '博 | 客 | 还 | 能 | 帮 | 助 | 学 | 生 | 提 | 高 | 写 | 作 | 能 | 力 | 尽 | 管 | 学 | 生 | 们 | 开 | 始 | 写 | 博 | 客 | 时 | 用 | 的 | 语 | 法 | 和 | 拼 | 写 | 往 | 往 | 都 | 很 | 马 | 虎 | 读 | 者 | 的 | 出 | 现 | 通 | 常 | 会 | 改 | 变 | 这 | 一 | 状 | 况 |',
  'num_samples': 196800,
  'gender': 'MALE'},
 {'id': 1793,
  'file_name': '7307792880988283491.wav',
  'raw_transcription': '如果你不习惯在乡村道路上开车,那可要保持头脑清醒:这里到处都是陡坡、窄车道和急转弯。',
  'transcription': '如 果 你 不 习 惯 在 乡 村 道 路 上 开 车 那 可 要 保 持 头 脑 清 醒 这 里 到 处 都 是 陡 坡 窄 车 道 和 急 转 弯',
  '_': '如 | 果 | 你 | 不 | 习 | 惯 | 在 | 乡 | 村 | 道 | 路 | 上 | 开 | 车 | 那 | 可 | 要 | 保 | 持 | 头 | 脑 | 清 | 醒 | 这 | 里 | 到 | 处 | 都 | 是 | 陡 | 坡 | 窄 | 车 | 道 | 和 | 急 | 转 | 弯 |',
  'num_samples': 283840,
  'gender': 'MALE'},
 {'id': 1793,
  'file_name': '6400610568256609872.wav',
  'raw_transcription': '如果你不习惯在乡村道路上开车,那可要保持头脑清醒:这里到处都是陡坡、窄车道和急转弯。',
  'transcription': '如 果 你 不 习 惯 在 乡 村 道 路 上 开 车 那 可 要 保 持 头 脑 清 醒 这 里 到 处 都 是 陡 坡 窄 车 道 和 急 转 弯',
  '_': '如 | 果 | 你 | 不 | 习 | 惯 | 在 | 乡 | 村 | 道 | 路 | 上 | 开 | 车 | 那 | 可 | 要 | 保 | 持 | 头 | 脑 | 清 | 醒 | 这 | 里 | 到 | 处 | 都 | 是 | 陡 | 坡 | 窄 | 车 | 道 | 和 | 急 | 转 | 弯 |',
  'num_samples': 186240,
  'gender': 'MALE'},
 {'id': 1793,
  'file_name': '16661739592848306669.wav',
  'raw_transcription': '如果你不习惯在乡村道路上开车,那可要保持头脑清醒:这里到处都是陡坡、窄车道和急转弯。',
  'transcription': '如 果 你 不 习 惯 在 乡 村 道 路 上 开 车 那 可 要 保 持 头 脑 清 醒 这 里 到 处 都 是 陡 坡 窄 车 道 和 急 转 弯',
  '_': '如 | 果 | 你 | 不 | 习 | 惯 | 在 | 乡 | 村 | 道 | 路 | 上 | 开 | 车 | 那 | 可 | 要 | 保 | 持 | 头 | 脑 | 清 | 醒 | 这 | 里 | 到 | 处 | 都 | 是 | 陡 | 坡 | 窄 | 车 | 道 | 和 | 急 | 转 | 弯 |',
  'num_samples': 139200,
  'gender': 'FEMALE'},
 {'id': 1712,
  'file_name': '10563386955236607431.wav',
  'raw_transcription': '自 1966 年以来,孙德尔本斯一直是野生动物保护区。据估计,目前该区生活着 400 只皇家孟加拉虎和大约 3 万只梅花鹿。',
  'transcription': '自 1966 年 以 来 孙 德 尔 本 斯 一 直 是 野 生 动 物 保 护 区 据 估 计 目 前 该 区 生 活 着 400 只 皇 家 孟 加 拉 虎 和 大 约 3 万 只 梅 花 鹿',
  '_': '自 | 1 9 6 6 | 年 | 以 | 来 | 孙 | 德 | 尔 | 本 | 斯 | 一 | 直 | 是 | 野 | 生 | 动 | 物 | 保 | 护 | 区 | 据 | 估 | 计 | 目 | 前 | 该 | 区 | 生 | 活 | 着 | 4 0 0 | 只 | 皇 | 家 | 孟 | 加 | 拉 | 虎 | 和 | 大 | 约 | 3 | 万 | 只 | 梅 | 花 | 鹿 |',
  'num_samples': 191040,
  'gender': 'FEMALE'},
 {'id': 1712,
  'file_name': '12784782094841387872.wav',
  'raw_transcription': '自 1966 年以来,孙德尔本斯一直是野生动物保护区。据估计,目前该区生活着 400 只皇家孟加拉虎和大约 3 万只梅花鹿。',
  'transcription': '自 1966 年 以 来 孙 德 尔 本 斯 一 直 是 野 生 动 物 保 护 区 据 估 计 目 前 该 区 生 活 着 400 只 皇 家 孟 加 拉 虎 和 大 约 3 万 只 梅 花 鹿',
  '_': '自 | 1 9 6 6 | 年 | 以 | 来 | 孙 | 德 | 尔 | 本 | 斯 | 一 | 直 | 是 | 野 | 生 | 动 | 物 | 保 | 护 | 区 | 据 | 估 | 计 | 目 | 前 | 该 | 区 | 生 | 活 | 着 | 4 0 0 | 只 | 皇 | 家 | 孟 | 加 | 拉 | 虎 | 和 | 大 | 约 | 3 | 万 | 只 | 梅 | 花 | 鹿 |',
  'num_samples': 194880,
  'gender': 'FEMALE'},
 {'id': 1844,
  'file_name': '16260709137886124787.wav',
  'raw_transcription': '月球的表面由岩石和灰尘组成。月球的外层叫做地壳。',
  'transcription': '月 球 的 表 面 由 岩 石 和 灰 尘 组 成 月 球 的 外 层 叫 做 地 壳',
  '_': '月 | 球 | 的 | 表 | 面 | 由 | 岩 | 石 | 和 | 灰 | 尘 | 组 | 成 | 月 | 球 | 的 | 外 | 层 | 叫 | 做 | 地 | 壳 |',
  'num_samples': 225920,
  'gender': 'MALE'},
 {'id': 1678,
  'file_name': '13618157833815227507.wav',
  'raw_transcription': '奥利弗·萨克斯 (Oliver Sacks) 在他的论文《总统的演讲》中指出,那些因为脑损伤而无法理解语言的人仍然能够准确地判断说话人是否有诚意。',
  'transcription': '奥 利 弗 萨 克 斯 oliver sacks 在 他 的 论 文 总 统 的 演 讲 中 指 出 那 些 因 为 脑 损 伤 而 无 法 理 解 语 言 的 人 仍 然 能 够 准 确 地 判 断 说 话 人 是 否 有 诚 意',
  '_': '奥 | 利 | 弗 | 萨 | 克 | 斯 | o l i v e r | s a c k s | 在 | 他 | 的 | 论 | 文 | 总 | 统 | 的 | 演 | 讲 | 中 | 指 | 出 | 那 | 些 | 因 | 为 | 脑 | 损 | 伤 | 而 | 无 | 法 | 理 | 解 | 语 | 言 | 的 | 人 | 仍 | 然 | 能 | 够 | 准 | 确 | 地 | 判 | 断 | 说 | 话 | 人 | 是 | 否 | 有 | 诚 | 意 |',
  'num_samples': 281280,
  'gender': 'MALE'},
 {'id': 1678,
  'file_name': '3118364285610511138.wav',
  'raw_transcription': '奥利弗·萨克斯 (Oliver Sacks) 在他的论文《总统的演讲》中指出,那些因为脑损伤而无法理解语言的人仍然能够准确地判断说话人是否有诚意。',
  'transcription': '奥 利 弗 萨 克 斯 oliver sacks 在 他 的 论 文 总 统 的 演 讲 中 指 出 那 些 因 为 脑 损 伤 而 无 法 理 解 语 言 的 人 仍 然 能 够 准 确 地 判 断 说 话 人 是 否 有 诚 意',
  '_': '奥 | 利 | 弗 | 萨 | 克 | 斯 | o l i v e r | s a c k s | 在 | 他 | 的 | 论 | 文 | 总 | 统 | 的 | 演 | 讲 | 中 | 指 | 出 | 那 | 些 | 因 | 为 | 脑 | 损 | 伤 | 而 | 无 | 法 | 理 | 解 | 语 | 言 | 的 | 人 | 仍 | 然 | 能 | 够 | 准 | 确 | 地 | 判 | 断 | 说 | 话 | 人 | 是 | 否 | 有 | 诚 | 意 |',
  'num_samples': 209280,
  'gender': 'FEMALE'},
 {'id': 1670,
  'file_name': '9051525594423711202.wav',
  'raw_transcription': '“它们的热行为不像地球上的大型洞穴那么稳定,这些大型洞穴通常会保持相当恒定的温度,但它们与地下深穴的情况很相似,”亚利桑那州旗杆镇美国地质调查局 (USGS) 太空地质团队和北亚利桑那大学的格伦·库欣说道。',
  'transcription': '它 们 的 热 行 为 不 像 地 球 上 的 大 型 洞 穴 那 么 稳 定 这 些 大 型 洞 穴 通 常 会 保 持 相 当 恒 定 的 温 度 但 它 们 与 地 下 深 穴 的 情 况 很 相 似 亚 利 桑 那 州 旗 杆 镇 美 国 地 质 调 查 局 usgs 太 空 地 质 团 队 和 北 亚 利 桑 那 大 学 的 格 伦 库 欣 说 道',
  '_': '它 | 们 | 的 | 热 | 行 | 为 | 不 | 像 | 地 | 球 | 上 | 的 | 大 | 型 | 洞 | 穴 | 那 | 么 | 稳 | 定 | 这 | 些 | 大 | 型 | 洞 | 穴 | 通 | 常 | 会 | 保 | 持 | 相 | 当 | 恒 | 定 | 的 | 温 | 度 | 但 | 它 | 们 | 与 | 地 | 下 | 深 | 穴 | 的 | 情 | 况 | 很 | 相 | 似 | 亚 | 利 | 桑 | 那 | 州 | 旗 | 杆 | 镇 | 美 | 国 | 地 | 质 | 调 | 查 | 局 | u s g s | 太 | 空 | 地 | 质 | 团 | 队 | 和 | 北 | 亚 | 利 | 桑 | 那 | 大 | 学 | 的 | 格 | 伦 | 库 | 欣 | 说 | 道 |',
  'num_samples': 300480,
  'gender': 'FEMALE'},
 {'id': 1670,
  'file_name': '1626393343718951419.wav',
  'raw_transcription': '“它们的热行为不像地球上的大型洞穴那么稳定,这些大型洞穴通常会保持相当恒定的温度,但它们与地下深穴的情况很相似,”亚利桑那州旗杆镇美国地质调查局 (USGS) 太空地质团队和北亚利桑那大学的格伦·库欣说道。',
  'transcription': '它 们 的 热 行 为 不 像 地 球 上 的 大 型 洞 穴 那 么 稳 定 这 些 大 型 洞 穴 通 常 会 保 持 相 当 恒 定 的 温 度 但 它 们 与 地 下 深 穴 的 情 况 很 相 似 亚 利 桑 那 州 旗 杆 镇 美 国 地 质 调 查 局 usgs 太 空 地 质 团 队 和 北 亚 利 桑 那 大 学 的 格 伦 库 欣 说 道',
  '_': '它 | 们 | 的 | 热 | 行 | 为 | 不 | 像 | 地 | 球 | 上 | 的 | 大 | 型 | 洞 | 穴 | 那 | 么 | 稳 | 定 | 这 | 些 | 大 | 型 | 洞 | 穴 | 通 | 常 | 会 | 保 | 持 | 相 | 当 | 恒 | 定 | 的 | 温 | 度 | 但 | 它 | 们 | 与 | 地 | 下 | 深 | 穴 | 的 | 情 | 况 | 很 | 相 | 似 | 亚 | 利 | 桑 | 那 | 州 | 旗 | 杆 | 镇 | 美 | 国 | 地 | 质 | 调 | 查 | 局 | u s g s | 太 | 空 | 地 | 质 | 团 | 队 | 和 | 北 | 亚 | 利 | 桑 | 那 | 大 | 学 | 的 | 格 | 伦 | 库 | 欣 | 说 | 道 |',
  'num_samples': 411840,
  'gender': 'MALE'},
 {'id': 1972,
  'file_name': '17738549684744212080.wav',
  'raw_transcription': '很多人认为它们并非恐龙,因为它们有羽毛,会飞。',
  'transcription': '很 多 人 认 为 它 们 并 非 恐 龙 因 为 它 们 有 羽 毛 会 飞',
  '_': '很 | 多 | 人 | 认 | 为 | 它 | 们 | 并 | 非 | 恐 | 龙 | 因 | 为 | 它 | 们 | 有 | 羽 | 毛 | 会 | 飞 |',
  'num_samples': 76800,
  'gender': 'FEMALE'},
 {'id': 1972,
  'file_name': '13390342019630506873.wav',
  'raw_transcription': '很多人认为它们并非恐龙,因为它们有羽毛,会飞。',
  'transcription': '很 多 人 认 为 它 们 并 非 恐 龙 因 为 它 们 有 羽 毛 会 飞',
  '_': '很 | 多 | 人 | 认 | 为 | 它 | 们 | 并 | 非 | 恐 | 龙 | 因 | 为 | 它 | 们 | 有 | 羽 | 毛 | 会 | 飞 |',
  'num_samples': 133440,
  'gender': 'MALE'},
 {'id': 1972,
  'file_name': '3271185876670640343.wav',
  'raw_transcription': '很多人认为它们并非恐龙,因为它们有羽毛,会飞。',
  'transcription': '很 多 人 认 为 它 们 并 非 恐 龙 因 为 它 们 有 羽 毛 会 飞',
  '_': '很 | 多 | 人 | 认 | 为 | 它 | 们 | 并 | 非 | 恐 | 龙 | 因 | 为 | 它 | 们 | 有 | 羽 | 毛 | 会 | 飞 |',
  'num_samples': 160000,
  'gender': 'MALE'},
 {'id': 1835,
  'file_name': '18270669392740472839.wav',
  'raw_transcription': '目前还没有发布海啸预警。根据雅加达地质局的说法,由于此次地震没有达到 6.5 级,因此不会发布海啸预警。',
  'transcription': '目 前 还 没 有 发 布 海 啸 预 警 根 据 雅 加 达 地 质 局 的 说 法 由 于 此 次 地 震 没 有 达 到 6.5 级 因 此 不 会 发 布 海 啸 预 警',
  '_': '目 | 前 | 还 | 没 | 有 | 发 | 布 | 海 | 啸 | 预 | 警 | 根 | 据 | 雅 | 加 | 达 | 地 | 质 | 局 | 的 | 说 | 法 | 由 | 于 | 此 | 次 | 地 | 震 | 没 | 有 | 达 | 到 | 6 . 5 | 级 | 因 | 此 | 不 | 会 | 发 | 布 | 海 | 啸 | 预 | 警 |',
  'num_samples': 262400,
  'gender': 'MALE'},
 {'id': 1835,
  'file_name': '11978977212440767838.wav',
  'raw_transcription': '目前还没有发布海啸预警。根据雅加达地质局的说法,由于此次地震没有达到 6.5 级,因此不会发布海啸预警。',
  'transcription': '目 前 还 没 有 发 布 海 啸 预 警 根 据 雅 加 达 地 质 局 的 说 法 由 于 此 次 地 震 没 有 达 到 6.5 级 因 此 不 会 发 布 海 啸 预 警',
  '_': '目 | 前 | 还 | 没 | 有 | 发 | 布 | 海 | 啸 | 预 | 警 | 根 | 据 | 雅 | 加 | 达 | 地 | 质 | 局 | 的 | 说 | 法 | 由 | 于 | 此 | 次 | 地 | 震 | 没 | 有 | 达 | 到 | 6 . 5 | 级 | 因 | 此 | 不 | 会 | 发 | 布 | 海 | 啸 | 预 | 警 |',
  'num_samples': 166080,
  'gender': 'FEMALE'},
 {'id': 1835,
  'file_name': '17232158003733395215.wav',
  'raw_transcription': '目前还没有发布海啸预警。根据雅加达地质局的说法,由于此次地震没有达到 6.5 级,因此不会发布海啸预警。',
  'transcription': '目 前 还 没 有 发 布 海 啸 预 警 根 据 雅 加 达 地 质 局 的 说 法 由 于 此 次 地 震 没 有 达 到 6.5 级 因 此 不 会 发 布 海 啸 预 警',
  '_': '目 | 前 | 还 | 没 | 有 | 发 | 布 | 海 | 啸 | 预 | 警 | 根 | 据 | 雅 | 加 | 达 | 地 | 质 | 局 | 的 | 说 | 法 | 由 | 于 | 此 | 次 | 地 | 震 | 没 | 有 | 达 | 到 | 6 . 5 | 级 | 因 | 此 | 不 | 会 | 发 | 布 | 海 | 啸 | 预 | 警 |',
  'num_samples': 285760,
  'gender': 'MALE'},
 {'id': 1751,
  'file_name': '13552313631282340467.wav',
  'raw_transcription': '这场辩论是因为对卡特里娜飓风后的救济和重建支出有争议而开始的;一些财政保守派幽默地将其称为“布什的新(奥尔良)政”。',
  'transcription': '这 场 辩 论 是 因 为 对 卡 特 里 娜 飓 风 后 的 救 济 和 重 建 支 出 有 争 议 而 开 始 的 一 些 财 政 保 守 派 幽 默 地 将 其 称 为 布 什 的 新 奥 尔 良 政',
  '_': '这 | 场 | 辩 | 论 | 是 | 因 | 为 | 对 | 卡 | 特 | 里 | 娜 | 飓 | 风 | 后 | 的 | 救 | 济 | 和 | 重 | 建 | 支 | 出 | 有 | 争 | 议 | 而 | 开 | 始 | 的 | 一 | 些 | 财 | 政 | 保 | 守 | 派 | 幽 | 默 | 地 | 将 | 其 | 称 | 为 | 布 | 什 | 的 | 新 | 奥 | 尔 | 良 | 政 |',
  'num_samples': 213120,
  'gender': 'FEMALE'},
 {'id': 1751,
  'file_name': '18220678308049336371.wav',
  'raw_transcription': '这场辩论是因为对卡特里娜飓风后的救济和重建支出有争议而开始的;一些财政保守派幽默地将其称为“布什的新(奥尔良)政”。',
  'transcription': '这 场 辩 论 是 因 为 对 卡 特 里 娜 飓 风 后 的 救 济 和 重 建 支 出 有 争 议 而 开 始 的 一 些 财 政 保 守 派 幽 默 地 将 其 称 为 布 什 的 新 奥 尔 良 政',
  '_': '这 | 场 | 辩 | 论 | 是 | 因 | 为 | 对 | 卡 | 特 | 里 | 娜 | 飓 | 风 | 后 | 的 | 救 | 济 | 和 | 重 | 建 | 支 | 出 | 有 | 争 | 议 | 而 | 开 | 始 | 的 | 一 | 些 | 财 | 政 | 保 | 守 | 派 | 幽 | 默 | 地 | 将 | 其 | 称 | 为 | 布 | 什 | 的 | 新 | 奥 | 尔 | 良 | 政 |',
  'num_samples': 240000,
  'gender': 'MALE'},
 {'id': 1751,
  'file_name': '11696571406957484423.wav',
  'raw_transcription': '这场辩论是因为对卡特里娜飓风后的救济和重建支出有争议而开始的;一些财政保守派幽默地将其称为“布什的新(奥尔良)政”。',
  'transcription': '这 场 辩 论 是 因 为 对 卡 特 里 娜 飓 风 后 的 救 济 和 重 建 支 出 有 争 议 而 开 始 的 一 些 财 政 保 守 派 幽 默 地 将 其 称 为 布 什 的 新 奥 尔 良 政',
  '_': '这 | 场 | 辩 | 论 | 是 | 因 | 为 | 对 | 卡 | 特 | 里 | 娜 | 飓 | 风 | 后 | 的 | 救 | 济 | 和 | 重 | 建 | 支 | 出 | 有 | 争 | 议 | 而 | 开 | 始 | 的 | 一 | 些 | 财 | 政 | 保 | 守 | 派 | 幽 | 默 | 地 | 将 | 其 | 称 | 为 | 布 | 什 | 的 | 新 | 奥 | 尔 | 良 | 政 |',
  'num_samples': 403840,
  'gender': 'MALE'},
 {'id': 1902,
  'file_name': '11312133319444370373.wav',
  'raw_transcription': '起初,他被送往位于大雅茅斯的詹姆斯·佩吉特医院进行救治。',
  'transcription': '起 初 他 被 送 往 位 于 大 雅 茅 斯 的 詹 姆 斯 佩 吉 特 医 院 进 行 救 治',
  '_': '起 | 初 | 他 | 被 | 送 | 往 | 位 | 于 | 大 | 雅 | 茅 | 斯 | 的 | 詹 | 姆 | 斯 | 佩 | 吉 | 特 | 医 | 院 | 进 | 行 | 救 | 治 |',
  'num_samples': 239680,
  'gender': 'MALE'},
 {'id': 1902,
  'file_name': '1015891181557233386.wav',
  'raw_transcription': '起初,他被送往位于大雅茅斯的詹姆斯·佩吉特医院进行救治。',
  'transcription': '起 初 他 被 送 往 位 于 大 雅 茅 斯 的 詹 姆 斯 佩 吉 特 医 院 进 行 救 治',
  '_': '起 | 初 | 他 | 被 | 送 | 往 | 位 | 于 | 大 | 雅 | 茅 | 斯 | 的 | 詹 | 姆 | 斯 | 佩 | 吉 | 特 | 医 | 院 | 进 | 行 | 救 | 治 |',
  'num_samples': 111360,
  'gender': 'FEMALE'},
 {'id': 1902,
  'file_name': '8783858264790777331.wav',
  'raw_transcription': '起初,他被送往位于大雅茅斯的詹姆斯·佩吉特医院进行救治。',
  'transcription': '起 初 他 被 送 往 位 于 大 雅 茅 斯 的 詹 姆 斯 佩 吉 特 医 院 进 行 救 治',
  '_': '起 | 初 | 他 | 被 | 送 | 往 | 位 | 于 | 大 | 雅 | 茅 | 斯 | 的 | 詹 | 姆 | 斯 | 佩 | 吉 | 特 | 医 | 院 | 进 | 行 | 救 | 治 |',
  'num_samples': 215040,
  'gender': 'MALE'},
 {'id': 1882,
  'file_name': '1690695920871902134.wav',
  'raw_transcription': '科学家希望了解自从彗星很久以前与地球相撞以来,行星是如何形成的,尤其是地球的形成方式。',
  'transcription': '科 学 家 希 望 了 解 自 从 彗 星 很 久 以 前 与 地 球 相 撞 以 来 行 星 是 如 何 形 成 的 尤 其 是 地 球 的 形 成 方 式',
  '_': '科 | 学 | 家 | 希 | 望 | 了 | 解 | 自 | 从 | 彗 | 星 | 很 | 久 | 以 | 前 | 与 | 地 | 球 | 相 | 撞 | 以 | 来 | 行 | 星 | 是 | 如 | 何 | 形 | 成 | 的 | 尤 | 其 | 是 | 地 | 球 | 的 | 形 | 成 | 方 | 式 |',
  'num_samples': 250560,
  'gender': 'MALE'},
 {'id': 1882,
  'file_name': '17937637094936923805.wav',
  'raw_transcription': '科学家希望了解自从彗星很久以前与地球相撞以来,行星是如何形成的,尤其是地球的形成方式。',
  'transcription': '科 学 家 希 望 了 解 自 从 彗 星 很 久 以 前 与 地 球 相 撞 以 来 行 星 是 如 何 形 成 的 尤 其 是 地 球 的 形 成 方 式',
  '_': '科 | 学 | 家 | 希 | 望 | 了 | 解 | 自 | 从 | 彗 | 星 | 很 | 久 | 以 | 前 | 与 | 地 | 球 | 相 | 撞 | 以 | 来 | 行 | 星 | 是 | 如 | 何 | 形 | 成 | 的 | 尤 | 其 | 是 | 地 | 球 | 的 | 形 | 成 | 方 | 式 |',
  'num_samples': 220480,
  'gender': 'MALE'},
 {'id': 1882,
  'file_name': '13148753915679283819.wav',
  'raw_transcription': '科学家希望了解自从彗星很久以前与地球相撞以来,行星是如何形成的,尤其是地球的形成方式。',
  'transcription': '科 学 家 希 望 了 解 自 从 彗 星 很 久 以 前 与 地 球 相 撞 以 来 行 星 是 如 何 形 成 的 尤 其 是 地 球 的 形 成 方 式',
  '_': '科 | 学 | 家 | 希 | 望 | 了 | 解 | 自 | 从 | 彗 | 星 | 很 | 久 | 以 | 前 | 与 | 地 | 球 | 相 | 撞 | 以 | 来 | 行 | 星 | 是 | 如 | 何 | 形 | 成 | 的 | 尤 | 其 | 是 | 地 | 球 | 的 | 形 | 成 | 方 | 式 |',
  'num_samples': 204480,
  'gender': 'MALE'},
 {'id': 1951,
  'file_name': '1065812790870009684.wav',
  'raw_transcription': '2002 年,戈马被尼拉贡戈火山的熔岩所摧毁。火山熔岩掩埋了该镇的大部分街道,尤其是镇中心。',
  'transcription': '2002 年 戈 马 被 尼 拉 贡 戈 火 山 的 熔 岩 所 摧 毁 火 山 熔 岩 掩 埋 了 该 镇 的 大 部 分 街 道 尤 其 是 镇 中 心',
  '_': '2 0 0 2 | 年 | 戈 | 马 | 被 | 尼 | 拉 | 贡 | 戈 | 火 | 山 | 的 | 熔 | 岩 | 所 | 摧 | 毁 | 火 | 山 | 熔 | 岩 | 掩 | 埋 | 了 | 该 | 镇 | 的 | 大 | 部 | 分 | 街 | 道 | 尤 | 其 | 是 | 镇 | 中 | 心 |',
  'num_samples': 269760,
  'gender': 'MALE'},
 {'id': 1951,
  'file_name': '7663590454133898685.wav',
  'raw_transcription': '2002 年,戈马被尼拉贡戈火山的熔岩所摧毁。火山熔岩掩埋了该镇的大部分街道,尤其是镇中心。',
  'transcription': '2002 年 戈 马 被 尼 拉 贡 戈 火 山 的 熔 岩 所 摧 毁 火 山 熔 岩 掩 埋 了 该 镇 的 大 部 分 街 道 尤 其 是 镇 中 心',
  '_': '2 0 0 2 | 年 | 戈 | 马 | 被 | 尼 | 拉 | 贡 | 戈 | 火 | 山 | 的 | 熔 | 岩 | 所 | 摧 | 毁 | 火 | 山 | 熔 | 岩 | 掩 | 埋 | 了 | 该 | 镇 | 的 | 大 | 部 | 分 | 街 | 道 | 尤 | 其 | 是 | 镇 | 中 | 心 |',
  'num_samples': 180480,
  'gender': 'FEMALE'},
 {'id': 1976,
  'file_name': '636015471615578334.wav',
  'raw_transcription': '中局击球手萨钦·坦杜尔卡和拉胡尔·德拉维德表现出色,搭档取得了 100 跑的成绩。',
  'transcription': '中 局 击 球 手 萨 钦 坦 杜 尔 卡 和 拉 胡 尔 德 拉 维 德 表 现 出 色 搭 档 取 得 了 100 跑 的 成 绩',
  '_': '中 | 局 | 击 | 球 | 手 | 萨 | 钦 | 坦 | 杜 | 尔 | 卡 | 和 | 拉 | 胡 | 尔 | 德 | 拉 | 维 | 德 | 表 | 现 | 出 | 色 | 搭 | 档 | 取 | 得 | 了 | 1 0 0 | 跑 | 的 | 成 | 绩 |',
  'num_samples': 174720,
  'gender': 'MALE'},
 {'id': 1976,
  'file_name': '1335059862743381812.wav',
  'raw_transcription': '中局击球手萨钦·坦杜尔卡和拉胡尔·德拉维德表现出色,搭档取得了 100 跑的成绩。',
  'transcription': '中 局 击 球 手 萨 钦 坦 杜 尔 卡 和 拉 胡 尔 德 拉 维 德 表 现 出 色 搭 档 取 得 了 100 跑 的 成 绩',
  '_': '中 | 局 | 击 | 球 | 手 | 萨 | 钦 | 坦 | 杜 | 尔 | 卡 | 和 | 拉 | 胡 | 尔 | 德 | 拉 | 维 | 德 | 表 | 现 | 出 | 色 | 搭 | 档 | 取 | 得 | 了 | 1 0 0 | 跑 | 的 | 成 | 绩 |',
  'num_samples': 203520,
  'gender': 'MALE'},
 {'id': 1685,
  'file_name': '12934408852186207896.wav',
  'raw_transcription': '例如,世界上最常见的静态图像摄影格式是 35mm 格式,这是胶片电影时代末期占主导地位的电影尺寸。',
  'transcription': '例 如 世 界 上 最 常 见 的 静 态 图 像 摄 影 格 式 是 35mm 格 式 这 是 胶 片 电 影 时 代 末 期 占 主 导 地 位 的 电 影 尺 寸',
  '_': '例 | 如 | 世 | 界 | 上 | 最 | 常 | 见 | 的 | 静 | 态 | 图 | 像 | 摄 | 影 | 格 | 式 | 是 | 3 5 m m | 格 | 式 | 这 | 是 | 胶 | 片 | 电 | 影 | 时 | 代 | 末 | 期 | 占 | 主 | 导 | 地 | 位 | 的 | 电 | 影 | 尺 | 寸 |',
  'num_samples': 171840,
  'gender': 'MALE'},
 {'id': 1685,
  'file_name': '12214278322285118031.wav',
  'raw_transcription': '例如,世界上最常见的静态图像摄影格式是 35mm 格式,这是胶片电影时代末期占主导地位的电影尺寸。',
  'transcription': '例 如 世 界 上 最 常 见 的 静 态 图 像 摄 影 格 式 是 35mm 格 式 这 是 胶 片 电 影 时 代 末 期 占 主 导 地 位 的 电 影 尺 寸',
  '_': '例 | 如 | 世 | 界 | 上 | 最 | 常 | 见 | 的 | 静 | 态 | 图 | 像 | 摄 | 影 | 格 | 式 | 是 | 3 5 m m | 格 | 式 | 这 | 是 | 胶 | 片 | 电 | 影 | 时 | 代 | 末 | 期 | 占 | 主 | 导 | 地 | 位 | 的 | 电 | 影 | 尺 | 寸 |',
  'num_samples': 181440,
  'gender': 'FEMALE'},
 {'id': 1685,
  'file_name': '8502084330070500277.wav',
  'raw_transcription': '例如,世界上最常见的静态图像摄影格式是 35mm 格式,这是胶片电影时代末期占主导地位的电影尺寸。',
  'transcription': '例 如 世 界 上 最 常 见 的 静 态 图 像 摄 影 格 式 是 35mm 格 式 这 是 胶 片 电 影 时 代 末 期 占 主 导 地 位 的 电 影 尺 寸',
  '_': '例 | 如 | 世 | 界 | 上 | 最 | 常 | 见 | 的 | 静 | 态 | 图 | 像 | 摄 | 影 | 格 | 式 | 是 | 3 5 m m | 格 | 式 | 这 | 是 | 胶 | 片 | 电 | 影 | 时 | 代 | 末 | 期 | 占 | 主 | 导 | 地 | 位 | 的 | 电 | 影 | 尺 | 寸 |',
  'num_samples': 215040,
  'gender': 'MALE'},
 {'id': 1748,
  'file_name': '7280750437299716613.wav',
  'raw_transcription': '消防救援人员最终在晚上 11 点 35 分扑灭了大火。',
  'transcription': '消 防 救 援 人 员 最 终 在 晚 上 11 点 35 分 扑 灭 了 大 火',
  '_': '消 | 防 | 救 | 援 | 人 | 员 | 最 | 终 | 在 | 晚 | 上 | 1 1 | 点 | 3 5 | 分 | 扑 | 灭 | 了 | 大 | 火 |',
  'num_samples': 89280,
  'gender': 'FEMALE'},
 {'id': 1748,
  'file_name': '7890052019880694182.wav',
  'raw_transcription': '消防救援人员最终在晚上 11 点 35 分扑灭了大火。',
  'transcription': '消 防 救 援 人 员 最 终 在 晚 上 11 点 35 分 扑 灭 了 大 火',
  '_': '消 | 防 | 救 | 援 | 人 | 员 | 最 | 终 | 在 | 晚 | 上 | 1 1 | 点 | 3 5 | 分 | 扑 | 灭 | 了 | 大 | 火 |',
  'num_samples': 116160,
  'gender': 'MALE'},
 {'id': 1765,
  'file_name': '4776739255978844398.wav',
  'raw_transcription': '自从 1537 年亚松森(Asunción)建成以来,巴拉圭一直设法保留了这座城的许多本土特色和特性。',
  'transcription': '自从 1537 年亚松森asunción建成以来巴拉圭一直设法保留了这座城的许多本土特色和特性',
  '_': '自 从 | 1 5 3 7 | 年 亚 松 森 a s u n c i ó n 建 成 以 来 巴 拉 圭 一 直 设 法 保 留 了 这 座 城 的 许 多 本 土 特 色 和 特 性 |',
  'num_samples': 132480,
  'gender': 'FEMALE'},
 {'id': 1765,
  'file_name': '1919235771608723899.wav',
  'raw_transcription': '自从 1537 年亚松森(Asunción)建成以来,巴拉圭一直设法保留了这座城的许多本土特色和特性。',
  'transcription': '自从 1537 年亚松森asunción建成以来巴拉圭一直设法保留了这座城的许多本土特色和特性',
  '_': '自 从 | 1 5 3 7 | 年 亚 松 森 a s u n c i ó n 建 成 以 来 巴 拉 圭 一 直 设 法 保 留 了 这 座 城 的 许 多 本 土 特 色 和 特 性 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1765,
  'file_name': '16086501413095318121.wav',
  'raw_transcription': '自从 1537 年亚松森(Asunción)建成以来,巴拉圭一直设法保留了这座城的许多本土特色和特性。',
  'transcription': '自从 1537 年亚松森asunción建成以来巴拉圭一直设法保留了这座城的许多本土特色和特性',
  '_': '自 从 | 1 5 3 7 | 年 亚 松 森 a s u n c i ó n 建 成 以 来 巴 拉 圭 一 直 设 法 保 留 了 这 座 城 的 许 多 本 土 特 色 和 特 性 |',
  'num_samples': 210240,
  'gender': 'MALE'},
 {'id': 1899,
  'file_name': '8277463471762550023.wav',
  'raw_transcription': '穆罕默德对尘世生活之外的事十分感兴趣。他以前经常到“努尔”(光明)山上一个叫做”希拉“的山洞里去冥想。',
  'transcription': '穆罕默德对尘世生活之外的事十分感兴趣他以前经常到 努尔”光明山上一个叫做”希拉 的山洞里去冥想',
  '_': '穆 罕 默 德 对 尘 世 生 活 之 外 的 事 十 分 感 兴 趣 他 以 前 经 常 到 | 努 尔 ” 光 明 山 上 一 个 叫 做 ” 希 拉 | 的 山 洞 里 去 冥 想 |',
  'num_samples': 251520,
  'gender': 'MALE'},
 {'id': 1899,
  'file_name': '15945841707755600355.wav',
  'raw_transcription': '穆罕默德对尘世生活之外的事十分感兴趣。他以前经常到“努尔”(光明)山上一个叫做”希拉“的山洞里去冥想。',
  'transcription': '穆罕默德对尘世生活之外的事十分感兴趣他以前经常到 努尔”光明山上一个叫做”希拉 的山洞里去冥想',
  '_': '穆 罕 默 德 对 尘 世 生 活 之 外 的 事 十 分 感 兴 趣 他 以 前 经 常 到 | 努 尔 ” 光 明 山 上 一 个 叫 做 ” 希 拉 | 的 山 洞 里 去 冥 想 |',
  'num_samples': 235200,
  'gender': 'MALE'},
 {'id': 1753,
  'file_name': '5468137042373581793.wav',
  'raw_transcription': '虽然这通常只是一种不准确的刻板印象,但在巴黎生活的最佳方式仍然是尽量举止得当,表现得像一个有 “bien élevé”(教养良好)的人。这会让参加社会活动变得容易得多。',
  'transcription': '虽然这通常只是一种不准确的刻板印象但在巴黎生活的最佳方式仍然是尽量举止得当表现得像一个有  bien élevé”教养良好的人这会让参加社会活动变得容易得多',
  '_': '虽 然 这 通 常 只 是 一 种 不 准 确 的 刻 板 印 象 但 在 巴 黎 生 活 的 最 佳 方 式 仍 然 是 尽 量 举 止 得 当 表 现 得 像 一 个 有 | b i e n | é l e v é ” 教 养 良 好 的 人 这 会 让 参 加 社 会 活 动 变 得 容 易 得 多 |',
  'num_samples': 281280,
  'gender': 'MALE'},
 {'id': 1753,
  'file_name': '16298512420216472244.wav',
  'raw_transcription': '虽然这通常只是一种不准确的刻板印象,但在巴黎生活的最佳方式仍然是尽量举止得当,表现得像一个有 “bien élevé”(教养良好)的人。这会让参加社会活动变得容易得多。',
  'transcription': '虽然这通常只是一种不准确的刻板印象但在巴黎生活的最佳方式仍然是尽量举止得当表现得像一个有  bien élevé”教养良好的人这会让参加社会活动变得容易得多',
  '_': '虽 然 这 通 常 只 是 一 种 不 准 确 的 刻 板 印 象 但 在 巴 黎 生 活 的 最 佳 方 式 仍 然 是 尽 量 举 止 得 当 表 现 得 像 一 个 有 | b i e n | é l e v é ” 教 养 良 好 的 人 这 会 让 参 加 社 会 活 动 变 得 容 易 得 多 |',
  'num_samples': 275520,
  'gender': 'FEMALE'},
 {'id': 1753,
  'file_name': '11289263923279091543.wav',
  'raw_transcription': '虽然这通常只是一种不准确的刻板印象,但在巴黎生活的最佳方式仍然是尽量举止得当,表现得像一个有 “bien élevé”(教养良好)的人。这会让参加社会活动变得容易得多。',
  'transcription': '虽然这通常只是一种不准确的刻板印象但在巴黎生活的最佳方式仍然是尽量举止得当表现得像一个有  bien élevé”教养良好的人这会让参加社会活动变得容易得多',
  '_': '虽 然 这 通 常 只 是 一 种 不 准 确 的 刻 板 印 象 但 在 巴 黎 生 活 的 最 佳 方 式 仍 然 是 尽 量 举 止 得 当 表 现 得 像 一 个 有 | b i e n | é l e v é ” 教 养 良 好 的 人 这 会 让 参 加 社 会 活 动 变 得 容 易 得 多 |',
  'num_samples': 230400,
  'gender': 'FEMALE'},
 {'id': 1787,
  'file_name': '15389160836364569900.wav',
  'raw_transcription': '写博客是一种能够激发合作的工具,还能鼓励学生把学习延伸到传统的学校授课之外。',
  'transcription': '写 博 客 是 一 种 能 够 激 发 合 作 的 工 具 还 能 鼓 励 学 生 把 学 习 延 伸 到 传 统 的 学 校 授 课 之 外',
  '_': '写 | 博 | 客 | 是 | 一 | 种 | 能 | 够 | 激 | 发 | 合 | 作 | 的 | 工 | 具 | 还 | 能 | 鼓 | 励 | 学 | 生 | 把 | 学 | 习 | 延 | 伸 | 到 | 传 | 统 | 的 | 学 | 校 | 授 | 课 | 之 | 外 |',
  'num_samples': 249920,
  'gender': 'MALE'},
 {'id': 1787,
  'file_name': '15084084705355118496.wav',
  'raw_transcription': '写博客是一种能够激发合作的工具,还能鼓励学生把学习延伸到传统的学校授课之外。',
  'transcription': '写 博 客 是 一 种 能 够 激 发 合 作 的 工 具 还 能 鼓 励 学 生 把 学 习 延 伸 到 传 统 的 学 校 授 课 之 外',
  '_': '写 | 博 | 客 | 是 | 一 | 种 | 能 | 够 | 激 | 发 | 合 | 作 | 的 | 工 | 具 | 还 | 能 | 鼓 | 励 | 学 | 生 | 把 | 学 | 习 | 延 | 伸 | 到 | 传 | 统 | 的 | 学 | 校 | 授 | 课 | 之 | 外 |',
  'num_samples': 154560,
  'gender': 'MALE'},
 {'id': 1787,
  'file_name': '619576706763969760.wav',
  'raw_transcription': '写博客是一种能够激发合作的工具,还能鼓励学生把学习延伸到传统的学校授课之外。',
  'transcription': '写 博 客 是 一 种 能 够 激 发 合 作 的 工 具 还 能 鼓 励 学 生 把 学 习 延 伸 到 传 统 的 学 校 授 课 之 外',
  '_': '写 | 博 | 客 | 是 | 一 | 种 | 能 | 够 | 激 | 发 | 合 | 作 | 的 | 工 | 具 | 还 | 能 | 鼓 | 励 | 学 | 生 | 把 | 学 | 习 | 延 | 伸 | 到 | 传 | 统 | 的 | 学 | 校 | 授 | 课 | 之 | 外 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1986,
  'file_name': '6432939278840582062.wav',
  'raw_transcription': '真正“隐形团队”的存在 (Larson 和 LaFasto,1989,p109),也是虚拟团队的一个独特组成部分。',
  'transcription': '真 正 隐 形 团 队 的 存 在 larson 和 lafasto 1989 p109 也 是 虚 拟 团 队 的 一 个 独 特 组 成 部 分',
  '_': '真 | 正 | 隐 | 形 | 团 | 队 | 的 | 存 | 在 | l a r s o n | 和 | l a f a s t o | 1 9 8 9 | p 1 0 9 | 也 | 是 | 虚 | 拟 | 团 | 队 | 的 | 一 | 个 | 独 | 特 | 组 | 成 | 部 | 分 |',
  'num_samples': 115200,
  'gender': 'MALE'},
 {'id': 1986,
  'file_name': '14300870981631473855.wav',
  'raw_transcription': '真正“隐形团队”的存在 (Larson 和 LaFasto,1989,p109),也是虚拟团队的一个独特组成部分。',
  'transcription': '真 正 隐 形 团 队 的 存 在 larson 和 lafasto 1989 p109 也 是 虚 拟 团 队 的 一 个 独 特 组 成 部 分',
  '_': '真 | 正 | 隐 | 形 | 团 | 队 | 的 | 存 | 在 | l a r s o n | 和 | l a f a s t o | 1 9 8 9 | p 1 0 9 | 也 | 是 | 虚 | 拟 | 团 | 队 | 的 | 一 | 个 | 独 | 特 | 组 | 成 | 部 | 分 |',
  'num_samples': 354560,
  'gender': 'MALE'},
 {'id': 1986,
  'file_name': '3991639199059870538.wav',
  'raw_transcription': '真正“隐形团队”的存在 (Larson 和 LaFasto,1989,p109),也是虚拟团队的一个独特组成部分。',
  'transcription': '真 正 隐 形 团 队 的 存 在 larson 和 lafasto 1989 p109 也 是 虚 拟 团 队 的 一 个 独 特 组 成 部 分',
  '_': '真 | 正 | 隐 | 形 | 团 | 队 | 的 | 存 | 在 | l a r s o n | 和 | l a f a s t o | 1 9 8 9 | p 1 0 9 | 也 | 是 | 虚 | 拟 | 团 | 队 | 的 | 一 | 个 | 独 | 特 | 组 | 成 | 部 | 分 |',
  'num_samples': 153600,
  'gender': 'FEMALE'},
 {'id': 1724,
  'file_name': '18229439828822167039.wav',
  'raw_transcription': '它作为奢侈品中心的声誉始于公元 400 年左右,一直延续到公元 1100 年左右。',
  'transcription': '它 作 为 奢 侈 品 中 心 的 声 誉 始 于 公 元 400 年 左 右 一 直 延 续 到 公 元 1100 年 左 右',
  '_': '它 | 作 | 为 | 奢 | 侈 | 品 | 中 | 心 | 的 | 声 | 誉 | 始 | 于 | 公 | 元 | 4 0 0 | 年 | 左 | 右 | 一 | 直 | 延 | 续 | 到 | 公 | 元 | 1 1 0 0 | 年 | 左 | 右 |',
  'num_samples': 165120,
  'gender': 'MALE'},
 {'id': 1724,
  'file_name': '6268497158786378126.wav',
  'raw_transcription': '它作为奢侈品中心的声誉始于公元 400 年左右,一直延续到公元 1100 年左右。',
  'transcription': '它 作 为 奢 侈 品 中 心 的 声 誉 始 于 公 元 400 年 左 右 一 直 延 续 到 公 元 1100 年 左 右',
  '_': '它 | 作 | 为 | 奢 | 侈 | 品 | 中 | 心 | 的 | 声 | 誉 | 始 | 于 | 公 | 元 | 4 0 0 | 年 | 左 | 右 | 一 | 直 | 延 | 续 | 到 | 公 | 元 | 1 1 0 0 | 年 | 左 | 右 |',
  'num_samples': 205440,
  'gender': 'MALE'},
 {'id': 1959,
  'file_name': '15574294182465851970.wav',
  'raw_transcription': '尽管如此,还是要听从有关部门的建议,遵守所有的标志并密切注意安全警告。',
  'transcription': '尽 管 如 此 还 是 要 听 从 有 关 部 门 的 建 议 遵 守 所 有 的 标 志 并 密 切 注 意 安 全 警 告',
  '_': '尽 | 管 | 如 | 此 | 还 | 是 | 要 | 听 | 从 | 有 | 关 | 部 | 门 | 的 | 建 | 议 | 遵 | 守 | 所 | 有 | 的 | 标 | 志 | 并 | 密 | 切 | 注 | 意 | 安 | 全 | 警 | 告 |',
  'num_samples': 126720,
  'gender': 'FEMALE'},
 {'id': 1959,
  'file_name': '17791339699136008364.wav',
  'raw_transcription': '尽管如此,还是要听从有关部门的建议,遵守所有的标志并密切注意安全警告。',
  'transcription': '尽 管 如 此 还 是 要 听 从 有 关 部 门 的 建 议 遵 守 所 有 的 标 志 并 密 切 注 意 安 全 警 告',
  '_': '尽 | 管 | 如 | 此 | 还 | 是 | 要 | 听 | 从 | 有 | 关 | 部 | 门 | 的 | 建 | 议 | 遵 | 守 | 所 | 有 | 的 | 标 | 志 | 并 | 密 | 切 | 注 | 意 | 安 | 全 | 警 | 告 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 1959,
  'file_name': '7719616471194846325.wav',
  'raw_transcription': '尽管如此,还是要听从有关部门的建议,遵守所有的标志并密切注意安全警告。',
  'transcription': '尽 管 如 此 还 是 要 听 从 有 关 部 门 的 建 议 遵 守 所 有 的 标 志 并 密 切 注 意 安 全 警 告',
  '_': '尽 | 管 | 如 | 此 | 还 | 是 | 要 | 听 | 从 | 有 | 关 | 部 | 门 | 的 | 建 | 议 | 遵 | 守 | 所 | 有 | 的 | 标 | 志 | 并 | 密 | 切 | 注 | 意 | 安 | 全 | 警 | 告 |',
  'num_samples': 174720,
  'gender': 'MALE'},
 {'id': 1859,
  'file_name': '6882850723115904525.wav',
  'raw_transcription': '随着中世纪走向末期,西欧人民逐渐发展出自己的风格。当时最大的进步之一就是十字军东征后,人们开始用纽扣来系衣服。',
  'transcription': '随 着 中 世 纪 走 向 末 期 西 欧 人 民 逐 渐 发 展 出 自 己 的 风 格 当 时 最 大 的 进 步 之 一 就 是 十 字 军 东 征 后 人 们 开 始 用 纽 扣 来 系 衣 服',
  '_': '随 | 着 | 中 | 世 | 纪 | 走 | 向 | 末 | 期 | 西 | 欧 | 人 | 民 | 逐 | 渐 | 发 | 展 | 出 | 自 | 己 | 的 | 风 | 格 | 当 | 时 | 最 | 大 | 的 | 进 | 步 | 之 | 一 | 就 | 是 | 十 | 字 | 军 | 东 | 征 | 后 | 人 | 们 | 开 | 始 | 用 | 纽 | 扣 | 来 | 系 | 衣 | 服 |',
  'num_samples': 224640,
  'gender': 'MALE'},
 {'id': 1859,
  'file_name': '7384974119415772248.wav',
  'raw_transcription': '随着中世纪走向末期,西欧人民逐渐发展出自己的风格。当时最大的进步之一就是十字军东征后,人们开始用纽扣来系衣服。',
  'transcription': '随 着 中 世 纪 走 向 末 期 西 欧 人 民 逐 渐 发 展 出 自 己 的 风 格 当 时 最 大 的 进 步 之 一 就 是 十 字 军 东 征 后 人 们 开 始 用 纽 扣 来 系 衣 服',
  '_': '随 | 着 | 中 | 世 | 纪 | 走 | 向 | 末 | 期 | 西 | 欧 | 人 | 民 | 逐 | 渐 | 发 | 展 | 出 | 自 | 己 | 的 | 风 | 格 | 当 | 时 | 最 | 大 | 的 | 进 | 步 | 之 | 一 | 就 | 是 | 十 | 字 | 军 | 东 | 征 | 后 | 人 | 们 | 开 | 始 | 用 | 纽 | 扣 | 来 | 系 | 衣 | 服 |',
  'num_samples': 305280,
  'gender': 'MALE'},
 {'id': 1820,
  'file_name': '7286380243700566982.wav',
  'raw_transcription': '人们现在在电脑屏幕上写信息,永远不必接触卷笔刀了。',
  'transcription': '人 们 现 在 在 电 脑 屏 幕 上 写 信 息 永 远 不 必 接 触 卷 笔 刀 了',
  '_': '人 | 们 | 现 | 在 | 在 | 电 | 脑 | 屏 | 幕 | 上 | 写 | 信 | 息 | 永 | 远 | 不 | 必 | 接 | 触 | 卷 | 笔 | 刀 | 了 |',
  'num_samples': 128640,
  'gender': 'MALE'},
 {'id': 1820,
  'file_name': '8997471766557804795.wav',
  'raw_transcription': '人们现在在电脑屏幕上写信息,永远不必接触卷笔刀了。',
  'transcription': '人 们 现 在 在 电 脑 屏 幕 上 写 信 息 永 远 不 必 接 触 卷 笔 刀 了',
  '_': '人 | 们 | 现 | 在 | 在 | 电 | 脑 | 屏 | 幕 | 上 | 写 | 信 | 息 | 永 | 远 | 不 | 必 | 接 | 触 | 卷 | 笔 | 刀 | 了 |',
  'num_samples': 141120,
  'gender': 'MALE'},
 {'id': 1820,
  'file_name': '16785823246087242981.wav',
  'raw_transcription': '人们现在在电脑屏幕上写信息,永远不必接触卷笔刀了。',
  'transcription': '人 们 现 在 在 电 脑 屏 幕 上 写 信 息 永 远 不 必 接 触 卷 笔 刀 了',
  '_': '人 | 们 | 现 | 在 | 在 | 电 | 脑 | 屏 | 幕 | 上 | 写 | 信 | 息 | 永 | 远 | 不 | 必 | 接 | 触 | 卷 | 笔 | 刀 | 了 |',
  'num_samples': 96960,
  'gender': 'FEMALE'},
 {'id': 1885,
  'file_name': '13764391043727501009.wav',
  'raw_transcription': '山区夏令时晚上 10 点到 11 点之间,院子里的犯人们引发了一场火灾。',
  'transcription': '山 区 夏 令 时 晚 上 10 点 到 11 点 之 间 院 子 里 的 犯 人 们 引 发 了 一 场 火 灾',
  '_': '山 | 区 | 夏 | 令 | 时 | 晚 | 上 | 1 0 | 点 | 到 | 1 1 | 点 | 之 | 间 | 院 | 子 | 里 | 的 | 犯 | 人 | 们 | 引 | 发 | 了 | 一 | 场 | 火 | 灾 |',
  'num_samples': 118080,
  'gender': 'FEMALE'},
 {'id': 1885,
  'file_name': '13896613977548790320.wav',
  'raw_transcription': '山区夏令时晚上 10 点到 11 点之间,院子里的犯人们引发了一场火灾。',
  'transcription': '山 区 夏 令 时 晚 上 10 点 到 11 点 之 间 院 子 里 的 犯 人 们 引 发 了 一 场 火 灾',
  '_': '山 | 区 | 夏 | 令 | 时 | 晚 | 上 | 1 0 | 点 | 到 | 1 1 | 点 | 之 | 间 | 院 | 子 | 里 | 的 | 犯 | 人 | 们 | 引 | 发 | 了 | 一 | 场 | 火 | 灾 |',
  'num_samples': 112320,
  'gender': 'FEMALE'},
 {'id': 1885,
  'file_name': '5418852816168724148.wav',
  'raw_transcription': '山区夏令时晚上 10 点到 11 点之间,院子里的犯人们引发了一场火灾。',
  'transcription': '山 区 夏 令 时 晚 上 10 点 到 11 点 之 间 院 子 里 的 犯 人 们 引 发 了 一 场 火 灾',
  '_': '山 | 区 | 夏 | 令 | 时 | 晚 | 上 | 1 0 | 点 | 到 | 1 1 | 点 | 之 | 间 | 院 | 子 | 里 | 的 | 犯 | 人 | 们 | 引 | 发 | 了 | 一 | 场 | 火 | 灾 |',
  'num_samples': 182080,
  'gender': 'MALE'},
 {'id': 1682,
  'file_name': '6889320356336789773.wav',
  'raw_transcription': '虽然没有人能确定作者是谁,但这个大型羊皮纸文档(尺寸为 29¾ 英寸乘以 24½ 英寸)据称在刚写成的时候是卷起来存放的。',
  'transcription': '虽然没有人能确定作者是谁但这个大型羊皮纸文档尺寸为 29¾ 英寸乘以 24½ 英寸据称在刚写成的时候是卷起来存放的',
  '_': '虽 然 没 有 人 能 确 定 作 者 是 谁 但 这 个 大 型 羊 皮 纸 文 档 尺 寸 为 | 2 9 ¾ | 英 寸 乘 以 | 2 4 ½ | 英 寸 据 称 在 刚 写 成 的 时 候 是 卷 起 来 存 放 的 |',
  'num_samples': 405440,
  'gender': 'MALE'},
 {'id': 1682,
  'file_name': '11229861275679868227.wav',
  'raw_transcription': '虽然没有人能确定作者是谁,但这个大型羊皮纸文档(尺寸为 29¾ 英寸乘以 24½ 英寸)据称在刚写成的时候是卷起来存放的。',
  'transcription': '虽然没有人能确定作者是谁但这个大型羊皮纸文档尺寸为 29¾ 英寸乘以 24½ 英寸据称在刚写成的时候是卷起来存放的',
  '_': '虽 然 没 有 人 能 确 定 作 者 是 谁 但 这 个 大 型 羊 皮 纸 文 档 尺 寸 为 | 2 9 ¾ | 英 寸 乘 以 | 2 4 ½ | 英 寸 据 称 在 刚 写 成 的 时 候 是 卷 起 来 存 放 的 |',
  'num_samples': 308800,
  'gender': 'MALE'},
 {'id': 1682,
  'file_name': '6417504991114206780.wav',
  'raw_transcription': '虽然没有人能确定作者是谁,但这个大型羊皮纸文档(尺寸为 29¾ 英寸乘以 24½ 英寸)据称在刚写成的时候是卷起来存放的。',
  'transcription': '虽然没有人能确定作者是谁但这个大型羊皮纸文档尺寸为 29¾ 英寸乘以 24½ 英寸据称在刚写成的时候是卷起来存放的',
  '_': '虽 然 没 有 人 能 确 定 作 者 是 谁 但 这 个 大 型 羊 皮 纸 文 档 尺 寸 为 | 2 9 ¾ | 英 寸 乘 以 | 2 4 ½ | 英 寸 据 称 在 刚 写 成 的 时 候 是 卷 起 来 存 放 的 |',
  'num_samples': 268800,
  'gender': 'MALE'},
 {'id': 1740,
  'file_name': '11109877895501140381.wav',
  'raw_transcription': '对儿童来说,金字塔的声光表演是该地区最有趣的活动之一。',
  'transcription': '对 儿 童 来 说 金 字 塔 的 声 光 表 演 是 该 地 区 最 有 趣 的 活 动 之 一',
  '_': '对 | 儿 | 童 | 来 | 说 | 金 | 字 | 塔 | 的 | 声 | 光 | 表 | 演 | 是 | 该 | 地 | 区 | 最 | 有 | 趣 | 的 | 活 | 动 | 之 | 一 |',
  'num_samples': 174400,
  'gender': 'MALE'},
 {'id': 1740,
  'file_name': '14842802317979485642.wav',
  'raw_transcription': '对儿童来说,金字塔的声光表演是该地区最有趣的活动之一。',
  'transcription': '对 儿 童 来 说 金 字 塔 的 声 光 表 演 是 该 地 区 最 有 趣 的 活 动 之 一',
  '_': '对 | 儿 | 童 | 来 | 说 | 金 | 字 | 塔 | 的 | 声 | 光 | 表 | 演 | 是 | 该 | 地 | 区 | 最 | 有 | 趣 | 的 | 活 | 动 | 之 | 一 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 1740,
  'file_name': '15325045899443293993.wav',
  'raw_transcription': '对儿童来说,金字塔的声光表演是该地区最有趣的活动之一。',
  'transcription': '对 儿 童 来 说 金 字 塔 的 声 光 表 演 是 该 地 区 最 有 趣 的 活 动 之 一',
  '_': '对 | 儿 | 童 | 来 | 说 | 金 | 字 | 塔 | 的 | 声 | 光 | 表 | 演 | 是 | 该 | 地 | 区 | 最 | 有 | 趣 | 的 | 活 | 动 | 之 | 一 |',
  'num_samples': 190720,
  'gender': 'MALE'},
 {'id': 1683,
  'file_name': '8477978912207506196.wav',
  'raw_transcription': '还是有许多男女在这里幸存了下来,他们如今仍然健在;而更多人的亲人,有的在那里被屠杀,有的一直做苦工到死,犹太人和非犹太人都是如此。',
  'transcription': '还 是 有 许 多 男 女 在 这 里 幸 存 了 下 来 他 们 如 今 仍 然 健 在 而 更 多 人 的 亲 人 有 的 在 那 里 被 屠 杀 有 的 一 直 做 苦 工 到 死 犹 太 人 和 非 犹 太 人 都 是 如 此',
  '_': '还 | 是 | 有 | 许 | 多 | 男 | 女 | 在 | 这 | 里 | 幸 | 存 | 了 | 下 | 来 | 他 | 们 | 如 | 今 | 仍 | 然 | 健 | 在 | 而 | 更 | 多 | 人 | 的 | 亲 | 人 | 有 | 的 | 在 | 那 | 里 | 被 | 屠 | 杀 | 有 | 的 | 一 | 直 | 做 | 苦 | 工 | 到 | 死 | 犹 | 太 | 人 | 和 | 非 | 犹 | 太 | 人 | 都 | 是 | 如 | 此 |',
  'num_samples': 187200,
  'gender': 'FEMALE'},
 {'id': 1841,
  'file_name': '17372474525289077221.wav',
  'raw_transcription': '除了清澈美丽的天空和周围的群山,什么也看不见。在洞穴中,几乎看不到也听不到外界的景象和声音。',
  'transcription': '除 了 清 澈 美 丽 的 天 空 和 周 围 的 群 山 什 么 也 看 不 见 在 洞 穴 中 几 乎 看 不 到 也 听 不 到 外 界 的 景 象 和 声 音',
  '_': '除 | 了 | 清 | 澈 | 美 | 丽 | 的 | 天 | 空 | 和 | 周 | 围 | 的 | 群 | 山 | 什 | 么 | 也 | 看 | 不 | 见 | 在 | 洞 | 穴 | 中 | 几 | 乎 | 看 | 不 | 到 | 也 | 听 | 不 | 到 | 外 | 界 | 的 | 景 | 象 | 和 | 声 | 音 |',
  'num_samples': 263360,
  'gender': 'MALE'},
 {'id': 1841,
  'file_name': '6274796882211990063.wav',
  'raw_transcription': '除了清澈美丽的天空和周围的群山,什么也看不见。在洞穴中,几乎看不到也听不到外界的景象和声音。',
  'transcription': '除 了 清 澈 美 丽 的 天 空 和 周 围 的 群 山 什 么 也 看 不 见 在 洞 穴 中 几 乎 看 不 到 也 听 不 到 外 界 的 景 象 和 声 音',
  '_': '除 | 了 | 清 | 澈 | 美 | 丽 | 的 | 天 | 空 | 和 | 周 | 围 | 的 | 群 | 山 | 什 | 么 | 也 | 看 | 不 | 见 | 在 | 洞 | 穴 | 中 | 几 | 乎 | 看 | 不 | 到 | 也 | 听 | 不 | 到 | 外 | 界 | 的 | 景 | 象 | 和 | 声 | 音 |',
  'num_samples': 168000,
  'gender': 'MALE'},
 {'id': 1841,
  'file_name': '5785773007586911320.wav',
  'raw_transcription': '除了清澈美丽的天空和周围的群山,什么也看不见。在洞穴中,几乎看不到也听不到外界的景象和声音。',
  'transcription': '除 了 清 澈 美 丽 的 天 空 和 周 围 的 群 山 什 么 也 看 不 见 在 洞 穴 中 几 乎 看 不 到 也 听 不 到 外 界 的 景 象 和 声 音',
  '_': '除 | 了 | 清 | 澈 | 美 | 丽 | 的 | 天 | 空 | 和 | 周 | 围 | 的 | 群 | 山 | 什 | 么 | 也 | 看 | 不 | 见 | 在 | 洞 | 穴 | 中 | 几 | 乎 | 看 | 不 | 到 | 也 | 听 | 不 | 到 | 外 | 界 | 的 | 景 | 象 | 和 | 声 | 音 |',
  'num_samples': 242240,
  'gender': 'MALE'},
 {'id': 1795,
  'file_name': '5655534691025010514.wav',
  'raw_transcription': '自 1988 年以来,投票箱就必须是透明的,这样选民和观察员才能看到投票开始时箱内没有信封,还能看到除了那些及时统计过、有权投票的选民以外,没有其他人向箱内投入信封。',
  'transcription': '自 1988 年 以 来 投 票 箱 就 必 须 是 透 明 的 这 样 选 民 和 观 察 员 才 能 看 到 投 票 开 始 时 箱 内 没 有 信 封 还 能 看 到 除 了 那 些 及 时 统 计 过 有 权 投 票 的 选 民 以 外 没 有 其 他 人 向 箱 内 投 入 信 封',
  '_': '自 | 1 9 8 8 | 年 | 以 | 来 | 投 | 票 | 箱 | 就 | 必 | 须 | 是 | 透 | 明 | 的 | 这 | 样 | 选 | 民 | 和 | 观 | 察 | 员 | 才 | 能 | 看 | 到 | 投 | 票 | 开 | 始 | 时 | 箱 | 内 | 没 | 有 | 信 | 封 | 还 | 能 | 看 | 到 | 除 | 了 | 那 | 些 | 及 | 时 | 统 | 计 | 过 | 有 | 权 | 投 | 票 | 的 | 选 | 民 | 以 | 外 | 没 | 有 | 其 | 他 | 人 | 向 | 箱 | 内 | 投 | 入 | 信 | 封 |',
  'num_samples': 497920,
  'gender': 'MALE'},
 {'id': 1795,
  'file_name': '1425508424982654623.wav',
  'raw_transcription': '自 1988 年以来,投票箱就必须是透明的,这样选民和观察员才能看到投票开始时箱内没有信封,还能看到除了那些及时统计过、有权投票的选民以外,没有其他人向箱内投入信封。',
  'transcription': '自 1988 年 以 来 投 票 箱 就 必 须 是 透 明 的 这 样 选 民 和 观 察 员 才 能 看 到 投 票 开 始 时 箱 内 没 有 信 封 还 能 看 到 除 了 那 些 及 时 统 计 过 有 权 投 票 的 选 民 以 外 没 有 其 他 人 向 箱 内 投 入 信 封',
  '_': '自 | 1 9 8 8 | 年 | 以 | 来 | 投 | 票 | 箱 | 就 | 必 | 须 | 是 | 透 | 明 | 的 | 这 | 样 | 选 | 民 | 和 | 观 | 察 | 员 | 才 | 能 | 看 | 到 | 投 | 票 | 开 | 始 | 时 | 箱 | 内 | 没 | 有 | 信 | 封 | 还 | 能 | 看 | 到 | 除 | 了 | 那 | 些 | 及 | 时 | 统 | 计 | 过 | 有 | 权 | 投 | 票 | 的 | 选 | 民 | 以 | 外 | 没 | 有 | 其 | 他 | 人 | 向 | 箱 | 内 | 投 | 入 | 信 | 封 |',
  'num_samples': 342720,
  'gender': 'MALE'},
 {'id': 1795,
  'file_name': '15565667203519061493.wav',
  'raw_transcription': '自 1988 年以来,投票箱就必须是透明的,这样选民和观察员才能看到投票开始时箱内没有信封,还能看到除了那些及时统计过、有权投票的选民以外,没有其他人向箱内投入信封。',
  'transcription': '自 1988 年 以 来 投 票 箱 就 必 须 是 透 明 的 这 样 选 民 和 观 察 员 才 能 看 到 投 票 开 始 时 箱 内 没 有 信 封 还 能 看 到 除 了 那 些 及 时 统 计 过 有 权 投 票 的 选 民 以 外 没 有 其 他 人 向 箱 内 投 入 信 封',
  '_': '自 | 1 9 8 8 | 年 | 以 | 来 | 投 | 票 | 箱 | 就 | 必 | 须 | 是 | 透 | 明 | 的 | 这 | 样 | 选 | 民 | 和 | 观 | 察 | 员 | 才 | 能 | 看 | 到 | 投 | 票 | 开 | 始 | 时 | 箱 | 内 | 没 | 有 | 信 | 封 | 还 | 能 | 看 | 到 | 除 | 了 | 那 | 些 | 及 | 时 | 统 | 计 | 过 | 有 | 权 | 投 | 票 | 的 | 选 | 民 | 以 | 外 | 没 | 有 | 其 | 他 | 人 | 向 | 箱 | 内 | 投 | 入 | 信 | 封 |',
  'num_samples': 264000,
  'gender': 'FEMALE'},
 {'id': 1693,
  'file_name': '2534110170083257824.wav',
  'raw_transcription': '但在队长输掉三柱门后,印度在结束这一局的比赛时只得了 36 分,输掉 7 个三柱门。',
  'transcription': '但 在 队 长 输 掉 三 柱 门 后 印 度 在 结 束 这 一 局 的 比 赛 时 只 得 了 36 分 输 掉 7 个 三 柱 门',
  '_': '但 | 在 | 队 | 长 | 输 | 掉 | 三 | 柱 | 门 | 后 | 印 | 度 | 在 | 结 | 束 | 这 | 一 | 局 | 的 | 比 | 赛 | 时 | 只 | 得 | 了 | 3 6 | 分 | 输 | 掉 | 7 | 个 | 三 | 柱 | 门 |',
  'num_samples': 224000,
  'gender': 'MALE'},
 {'id': 1693,
  'file_name': '12820953356240413400.wav',
  'raw_transcription': '但在队长输掉三柱门后,印度在结束这一局的比赛时只得了 36 分,输掉 7 个三柱门。',
  'transcription': '但 在 队 长 输 掉 三 柱 门 后 印 度 在 结 束 这 一 局 的 比 赛 时 只 得 了 36 分 输 掉 7 个 三 柱 门',
  '_': '但 | 在 | 队 | 长 | 输 | 掉 | 三 | 柱 | 门 | 后 | 印 | 度 | 在 | 结 | 束 | 这 | 一 | 局 | 的 | 比 | 赛 | 时 | 只 | 得 | 了 | 3 6 | 分 | 输 | 掉 | 7 | 个 | 三 | 柱 | 门 |',
  'num_samples': 201280,
  'gender': 'MALE'},
 {'id': 1693,
  'file_name': '16773027406903308033.wav',
  'raw_transcription': '但在队长输掉三柱门后,印度在结束这一局的比赛时只得了 36 分,输掉 7 个三柱门。',
  'transcription': '但 在 队 长 输 掉 三 柱 门 后 印 度 在 结 束 这 一 局 的 比 赛 时 只 得 了 36 分 输 掉 7 个 三 柱 门',
  '_': '但 | 在 | 队 | 长 | 输 | 掉 | 三 | 柱 | 门 | 后 | 印 | 度 | 在 | 结 | 束 | 这 | 一 | 局 | 的 | 比 | 赛 | 时 | 只 | 得 | 了 | 3 6 | 分 | 输 | 掉 | 7 | 个 | 三 | 柱 | 门 |',
  'num_samples': 205120,
  'gender': 'MALE'},
 {'id': 1900,
  'file_name': '1720759632051872729.wav',
  'raw_transcription': '事实上,即使知道它的存在,也不容易找到。一旦进入洞穴,就完全与世隔绝了。',
  'transcription': '事 实 上 即 使 知 道 它 的 存 在 也 不 容 易 找 到 一 旦 进 入 洞 穴 就 完 全 与 世 隔 绝 了',
  '_': '事 | 实 | 上 | 即 | 使 | 知 | 道 | 它 | 的 | 存 | 在 | 也 | 不 | 容 | 易 | 找 | 到 | 一 | 旦 | 进 | 入 | 洞 | 穴 | 就 | 完 | 全 | 与 | 世 | 隔 | 绝 | 了 |',
  'num_samples': 144000,
  'gender': 'MALE'},
 {'id': 1900,
  'file_name': '16445264553186067497.wav',
  'raw_transcription': '事实上,即使知道它的存在,也不容易找到。一旦进入洞穴,就完全与世隔绝了。',
  'transcription': '事 实 上 即 使 知 道 它 的 存 在 也 不 容 易 找 到 一 旦 进 入 洞 穴 就 完 全 与 世 隔 绝 了',
  '_': '事 | 实 | 上 | 即 | 使 | 知 | 道 | 它 | 的 | 存 | 在 | 也 | 不 | 容 | 易 | 找 | 到 | 一 | 旦 | 进 | 入 | 洞 | 穴 | 就 | 完 | 全 | 与 | 世 | 隔 | 绝 | 了 |',
  'num_samples': 240320,
  'gender': 'MALE'},
 {'id': 1900,
  'file_name': '14151954919593706241.wav',
  'raw_transcription': '事实上,即使知道它的存在,也不容易找到。一旦进入洞穴,就完全与世隔绝了。',
  'transcription': '事 实 上 即 使 知 道 它 的 存 在 也 不 容 易 找 到 一 旦 进 入 洞 穴 就 完 全 与 世 隔 绝 了',
  '_': '事 | 实 | 上 | 即 | 使 | 知 | 道 | 它 | 的 | 存 | 在 | 也 | 不 | 容 | 易 | 找 | 到 | 一 | 旦 | 进 | 入 | 洞 | 穴 | 就 | 完 | 全 | 与 | 世 | 隔 | 绝 | 了 |',
  'num_samples': 116160,
  'gender': 'FEMALE'},
 {'id': 1813,
  'file_name': '13557978123891400445.wav',
  'raw_transcription': '巴塞罗那的官方语言为加泰罗尼亚语和西班牙语。大约一半的当地人更愿意说加泰罗尼亚语,绝大多数人都听懂加泰罗尼亚语,至于西班牙语,几乎每个人都能听懂。',
  'transcription': '巴 塞 罗 那 的 官 方 语 言 为 加 泰 罗 尼 亚 语 和 西 班 牙 语 大 约 一 半 的 当 地 人 更 愿 意 说 加 泰 罗 尼 亚 语 绝 大 多 数 人 都 听 懂 加 泰 罗 尼 亚 语 至 于 西 班 牙 语 几 乎 每 个 人 都 能 听 懂',
  '_': '巴 | 塞 | 罗 | 那 | 的 | 官 | 方 | 语 | 言 | 为 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 和 | 西 | 班 | 牙 | 语 | 大 | 约 | 一 | 半 | 的 | 当 | 地 | 人 | 更 | 愿 | 意 | 说 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 绝 | 大 | 多 | 数 | 人 | 都 | 听 | 懂 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 至 | 于 | 西 | 班 | 牙 | 语 | 几 | 乎 | 每 | 个 | 人 | 都 | 能 | 听 | 懂 |',
  'num_samples': 229440,
  'gender': 'FEMALE'},
 {'id': 1813,
  'file_name': '1804247471288696323.wav',
  'raw_transcription': '巴塞罗那的官方语言为加泰罗尼亚语和西班牙语。大约一半的当地人更愿意说加泰罗尼亚语,绝大多数人都听懂加泰罗尼亚语,至于西班牙语,几乎每个人都能听懂。',
  'transcription': '巴 塞 罗 那 的 官 方 语 言 为 加 泰 罗 尼 亚 语 和 西 班 牙 语 大 约 一 半 的 当 地 人 更 愿 意 说 加 泰 罗 尼 亚 语 绝 大 多 数 人 都 听 懂 加 泰 罗 尼 亚 语 至 于 西 班 牙 语 几 乎 每 个 人 都 能 听 懂',
  '_': '巴 | 塞 | 罗 | 那 | 的 | 官 | 方 | 语 | 言 | 为 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 和 | 西 | 班 | 牙 | 语 | 大 | 约 | 一 | 半 | 的 | 当 | 地 | 人 | 更 | 愿 | 意 | 说 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 绝 | 大 | 多 | 数 | 人 | 都 | 听 | 懂 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 至 | 于 | 西 | 班 | 牙 | 语 | 几 | 乎 | 每 | 个 | 人 | 都 | 能 | 听 | 懂 |',
  'num_samples': 290880,
  'gender': 'MALE'},
 {'id': 1813,
  'file_name': '8413834405268986815.wav',
  'raw_transcription': '巴塞罗那的官方语言为加泰罗尼亚语和西班牙语。大约一半的当地人更愿意说加泰罗尼亚语,绝大多数人都听懂加泰罗尼亚语,至于西班牙语,几乎每个人都能听懂。',
  'transcription': '巴 塞 罗 那 的 官 方 语 言 为 加 泰 罗 尼 亚 语 和 西 班 牙 语 大 约 一 半 的 当 地 人 更 愿 意 说 加 泰 罗 尼 亚 语 绝 大 多 数 人 都 听 懂 加 泰 罗 尼 亚 语 至 于 西 班 牙 语 几 乎 每 个 人 都 能 听 懂',
  '_': '巴 | 塞 | 罗 | 那 | 的 | 官 | 方 | 语 | 言 | 为 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 和 | 西 | 班 | 牙 | 语 | 大 | 约 | 一 | 半 | 的 | 当 | 地 | 人 | 更 | 愿 | 意 | 说 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 绝 | 大 | 多 | 数 | 人 | 都 | 听 | 懂 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 至 | 于 | 西 | 班 | 牙 | 语 | 几 | 乎 | 每 | 个 | 人 | 都 | 能 | 听 | 懂 |',
  'num_samples': 360000,
  'gender': 'MALE'},
 {'id': 1786,
  'file_name': '5295622093543746825.wav',
  'raw_transcription': '通过红外光谱 (FTIR) 进行比较后发现,这些结晶的成分与在受影响宠物的尿液中发现的结晶成分吻合。',
  'transcription': '通 过 红 外 光 谱 ftir 进 行 比 较 后 发 现 这 些 结 晶 的 成 分 与 在 受 影 响 宠 物 的 尿 液 中 发 现 的 结 晶 成 分 吻 合',
  '_': '通 | 过 | 红 | 外 | 光 | 谱 | f t i r | 进 | 行 | 比 | 较 | 后 | 发 | 现 | 这 | 些 | 结 | 晶 | 的 | 成 | 分 | 与 | 在 | 受 | 影 | 响 | 宠 | 物 | 的 | 尿 | 液 | 中 | 发 | 现 | 的 | 结 | 晶 | 成 | 分 | 吻 | 合 |',
  'num_samples': 203520,
  'gender': 'MALE'},
 {'id': 1786,
  'file_name': '6938579942069683662.wav',
  'raw_transcription': '通过红外光谱 (FTIR) 进行比较后发现,这些结晶的成分与在受影响宠物的尿液中发现的结晶成分吻合。',
  'transcription': '通 过 红 外 光 谱 ftir 进 行 比 较 后 发 现 这 些 结 晶 的 成 分 与 在 受 影 响 宠 物 的 尿 液 中 发 现 的 结 晶 成 分 吻 合',
  '_': '通 | 过 | 红 | 外 | 光 | 谱 | f t i r | 进 | 行 | 比 | 较 | 后 | 发 | 现 | 这 | 些 | 结 | 晶 | 的 | 成 | 分 | 与 | 在 | 受 | 影 | 响 | 宠 | 物 | 的 | 尿 | 液 | 中 | 发 | 现 | 的 | 结 | 晶 | 成 | 分 | 吻 | 合 |',
  'num_samples': 217920,
  'gender': 'MALE'},
 {'id': 1786,
  'file_name': '13386006418804843806.wav',
  'raw_transcription': '通过红外光谱 (FTIR) 进行比较后发现,这些结晶的成分与在受影响宠物的尿液中发现的结晶成分吻合。',
  'transcription': '通 过 红 外 光 谱 ftir 进 行 比 较 后 发 现 这 些 结 晶 的 成 分 与 在 受 影 响 宠 物 的 尿 液 中 发 现 的 结 晶 成 分 吻 合',
  '_': '通 | 过 | 红 | 外 | 光 | 谱 | f t i r | 进 | 行 | 比 | 较 | 后 | 发 | 现 | 这 | 些 | 结 | 晶 | 的 | 成 | 分 | 与 | 在 | 受 | 影 | 响 | 宠 | 物 | 的 | 尿 | 液 | 中 | 发 | 现 | 的 | 结 | 晶 | 成 | 分 | 吻 | 合 |',
  'num_samples': 248000,
  'gender': 'MALE'},
 {'id': 1889,
  'file_name': '2639775160623300502.wav',
  'raw_transcription': '有了它,我们才有了火车、汽车和许多其他交通工具。',
  'transcription': '有 了 它 我 们 才 有 了 火 车 汽 车 和 许 多 其 他 交 通 工 具',
  '_': '有 | 了 | 它 | 我 | 们 | 才 | 有 | 了 | 火 | 车 | 汽 | 车 | 和 | 许 | 多 | 其 | 他 | 交 | 通 | 工 | 具 |',
  'num_samples': 170240,
  'gender': 'MALE'},
 {'id': 1889,
  'file_name': '17540203048667918423.wav',
  'raw_transcription': '有了它,我们才有了火车、汽车和许多其他交通工具。',
  'transcription': '有 了 它 我 们 才 有 了 火 车 汽 车 和 许 多 其 他 交 通 工 具',
  '_': '有 | 了 | 它 | 我 | 们 | 才 | 有 | 了 | 火 | 车 | 汽 | 车 | 和 | 许 | 多 | 其 | 他 | 交 | 通 | 工 | 具 |',
  'num_samples': 169600,
  'gender': 'MALE'},
 {'id': 1889,
  'file_name': '9353405661971774061.wav',
  'raw_transcription': '有了它,我们才有了火车、汽车和许多其他交通工具。',
  'transcription': '有 了 它 我 们 才 有 了 火 车 汽 车 和 许 多 其 他 交 通 工 具',
  '_': '有 | 了 | 它 | 我 | 们 | 才 | 有 | 了 | 火 | 车 | 汽 | 车 | 和 | 许 | 多 | 其 | 他 | 交 | 通 | 工 | 具 |',
  'num_samples': 201280,
  'gender': 'MALE'},
 {'id': 1865,
  'file_name': '16491868234508470928.wav',
  'raw_transcription': '圣彼得堡游轮包括城内观光活动。游轮乘客可获豁免签证(详情请参阅服务条款)。',
  'transcription': '圣 彼 得 堡 游 轮 包 括 城 内 观 光 活 动 游 轮 乘 客 可 获 豁 免 签 证 详 情 请 参 阅 服 务 条 款',
  '_': '圣 | 彼 | 得 | 堡 | 游 | 轮 | 包 | 括 | 城 | 内 | 观 | 光 | 活 | 动 | 游 | 轮 | 乘 | 客 | 可 | 获 | 豁 | 免 | 签 | 证 | 详 | 情 | 请 | 参 | 阅 | 服 | 务 | 条 | 款 |',
  'num_samples': 185280,
  'gender': 'MALE'},
 {'id': 1865,
  'file_name': '8978219181597999511.wav',
  'raw_transcription': '圣彼得堡游轮包括城内观光活动。游轮乘客可获豁免签证(详情请参阅服务条款)。',
  'transcription': '圣 彼 得 堡 游 轮 包 括 城 内 观 光 活 动 游 轮 乘 客 可 获 豁 免 签 证 详 情 请 参 阅 服 务 条 款',
  '_': '圣 | 彼 | 得 | 堡 | 游 | 轮 | 包 | 括 | 城 | 内 | 观 | 光 | 活 | 动 | 游 | 轮 | 乘 | 客 | 可 | 获 | 豁 | 免 | 签 | 证 | 详 | 情 | 请 | 参 | 阅 | 服 | 务 | 条 | 款 |',
  'num_samples': 237120,
  'gender': 'MALE'},
 {'id': 1971,
  'file_name': '2126783206362373464.wav',
  'raw_transcription': '狂风、冰雹、过量降水、山火,还有雷雨、龙卷风、水龙卷、气旋,都是极端天气的表现和影响。',
  'transcription': '狂 风 冰 雹 过 量 降 水 山 火 还 有 雷 雨 龙 卷 风 水 龙 卷 气 旋 都 是 极 端 天 气 的 表 现 和 影 响',
  '_': '狂 | 风 | 冰 | 雹 | 过 | 量 | 降 | 水 | 山 | 火 | 还 | 有 | 雷 | 雨 | 龙 | 卷 | 风 | 水 | 龙 | 卷 | 气 | 旋 | 都 | 是 | 极 | 端 | 天 | 气 | 的 | 表 | 现 | 和 | 影 | 响 |',
  'num_samples': 177600,
  'gender': 'MALE'},
 {'id': 1971,
  'file_name': '15229378135734068702.wav',
  'raw_transcription': '狂风、冰雹、过量降水、山火,还有雷雨、龙卷风、水龙卷、气旋,都是极端天气的表现和影响。',
  'transcription': '狂 风 冰 雹 过 量 降 水 山 火 还 有 雷 雨 龙 卷 风 水 龙 卷 气 旋 都 是 极 端 天 气 的 表 现 和 影 响',
  '_': '狂 | 风 | 冰 | 雹 | 过 | 量 | 降 | 水 | 山 | 火 | 还 | 有 | 雷 | 雨 | 龙 | 卷 | 风 | 水 | 龙 | 卷 | 气 | 旋 | 都 | 是 | 极 | 端 | 天 | 气 | 的 | 表 | 现 | 和 | 影 | 响 |',
  'num_samples': 181440,
  'gender': 'MALE'},
 {'id': 1971,
  'file_name': '10695273702291556205.wav',
  'raw_transcription': '狂风、冰雹、过量降水、山火,还有雷雨、龙卷风、水龙卷、气旋,都是极端天气的表现和影响。',
  'transcription': '狂 风 冰 雹 过 量 降 水 山 火 还 有 雷 雨 龙 卷 风 水 龙 卷 气 旋 都 是 极 端 天 气 的 表 现 和 影 响',
  '_': '狂 | 风 | 冰 | 雹 | 过 | 量 | 降 | 水 | 山 | 火 | 还 | 有 | 雷 | 雨 | 龙 | 卷 | 风 | 水 | 龙 | 卷 | 气 | 旋 | 都 | 是 | 极 | 端 | 天 | 气 | 的 | 表 | 现 | 和 | 影 | 响 |',
  'num_samples': 167040,
  'gender': 'MALE'},
 {'id': 1713,
  'file_name': '9239339870570537511.wav',
  'raw_transcription': '尽管戈马还算安全,但前往戈马以外的任何地方都应该事先调查,以便了解北基伍省持续的战斗有没有缓和。',
  'transcription': '尽 管 戈 马 还 算 安 全 但 前 往 戈 马 以 外 的 任 何 地 方 都 应 该 事 先 调 查 以 便 了 解 北 基 伍 省 持 续 的 战 斗 有 没 有 缓 和',
  '_': '尽 | 管 | 戈 | 马 | 还 | 算 | 安 | 全 | 但 | 前 | 往 | 戈 | 马 | 以 | 外 | 的 | 任 | 何 | 地 | 方 | 都 | 应 | 该 | 事 | 先 | 调 | 查 | 以 | 便 | 了 | 解 | 北 | 基 | 伍 | 省 | 持 | 续 | 的 | 战 | 斗 | 有 | 没 | 有 | 缓 | 和 |',
  'num_samples': 211200,
  'gender': 'MALE'},
 {'id': 1713,
  'file_name': '6707154898648432213.wav',
  'raw_transcription': '尽管戈马还算安全,但前往戈马以外的任何地方都应该事先调查,以便了解北基伍省持续的战斗有没有缓和。',
  'transcription': '尽 管 戈 马 还 算 安 全 但 前 往 戈 马 以 外 的 任 何 地 方 都 应 该 事 先 调 查 以 便 了 解 北 基 伍 省 持 续 的 战 斗 有 没 有 缓 和',
  '_': '尽 | 管 | 戈 | 马 | 还 | 算 | 安 | 全 | 但 | 前 | 往 | 戈 | 马 | 以 | 外 | 的 | 任 | 何 | 地 | 方 | 都 | 应 | 该 | 事 | 先 | 调 | 查 | 以 | 便 | 了 | 解 | 北 | 基 | 伍 | 省 | 持 | 续 | 的 | 战 | 斗 | 有 | 没 | 有 | 缓 | 和 |',
  'num_samples': 309440,
  'gender': 'MALE'},
 {'id': 1713,
  'file_name': '13358676656291940771.wav',
  'raw_transcription': '尽管戈马还算安全,但前往戈马以外的任何地方都应该事先调查,以便了解北基伍省持续的战斗有没有缓和。',
  'transcription': '尽 管 戈 马 还 算 安 全 但 前 往 戈 马 以 外 的 任 何 地 方 都 应 该 事 先 调 查 以 便 了 解 北 基 伍 省 持 续 的 战 斗 有 没 有 缓 和',
  '_': '尽 | 管 | 戈 | 马 | 还 | 算 | 安 | 全 | 但 | 前 | 往 | 戈 | 马 | 以 | 外 | 的 | 任 | 何 | 地 | 方 | 都 | 应 | 该 | 事 | 先 | 调 | 查 | 以 | 便 | 了 | 解 | 北 | 基 | 伍 | 省 | 持 | 续 | 的 | 战 | 斗 | 有 | 没 | 有 | 缓 | 和 |',
  'num_samples': 177600,
  'gender': 'MALE'},
 {'id': 1805,
  'file_name': '10112798408996336578.wav',
  'raw_transcription': 'Scotturb 403 路公共汽车定期发车前往辛特拉 (Sintra),在罗卡角停靠。',
  'transcription': 'scotturb 403 路 公 共 汽 车 定 期 发 车 前 往 辛 特 拉 sintra 在 罗 卡 角 停 靠',
  '_': 's c o t t u r b | 4 0 3 | 路 | 公 | 共 | 汽 | 车 | 定 | 期 | 发 | 车 | 前 | 往 | 辛 | 特 | 拉 | s i n t r a | 在 | 罗 | 卡 | 角 | 停 | 靠 |',
  'num_samples': 121920,
  'gender': 'FEMALE'},
 {'id': 1805,
  'file_name': '17625326964148946060.wav',
  'raw_transcription': 'Scotturb 403 路公共汽车定期发车前往辛特拉 (Sintra),在罗卡角停靠。',
  'transcription': 'scotturb 403 路 公 共 汽 车 定 期 发 车 前 往 辛 特 拉 sintra 在 罗 卡 角 停 靠',
  '_': 's c o t t u r b | 4 0 3 | 路 | 公 | 共 | 汽 | 车 | 定 | 期 | 发 | 车 | 前 | 往 | 辛 | 特 | 拉 | s i n t r a | 在 | 罗 | 卡 | 角 | 停 | 靠 |',
  'num_samples': 194880,
  'gender': 'MALE'},
 {'id': 1873,
  'file_name': '4239015119239021794.wav',
  'raw_transcription': '拒绝男人时要坚定,别害怕坚持自己的立场(不管文化有无差异,都要果断回绝!)。',
  'transcription': '拒 绝 男 人 时 要 坚 定 别 害 怕 坚 持 自 己 的 立 场 不 管 文 化 有 无 差 异 都 要 果 断 回 绝',
  '_': '拒 | 绝 | 男 | 人 | 时 | 要 | 坚 | 定 | 别 | 害 | 怕 | 坚 | 持 | 自 | 己 | 的 | 立 | 场 | 不 | 管 | 文 | 化 | 有 | 无 | 差 | 异 | 都 | 要 | 果 | 断 | 回 | 绝 |',
  'num_samples': 141120,
  'gender': 'MALE'},
 {'id': 1873,
  'file_name': '14531943642523377799.wav',
  'raw_transcription': '拒绝男人时要坚定,别害怕坚持自己的立场(不管文化有无差异,都要果断回绝!)。',
  'transcription': '拒 绝 男 人 时 要 坚 定 别 害 怕 坚 持 自 己 的 立 场 不 管 文 化 有 无 差 异 都 要 果 断 回 绝',
  '_': '拒 | 绝 | 男 | 人 | 时 | 要 | 坚 | 定 | 别 | 害 | 怕 | 坚 | 持 | 自 | 己 | 的 | 立 | 场 | 不 | 管 | 文 | 化 | 有 | 无 | 差 | 异 | 都 | 要 | 果 | 断 | 回 | 绝 |',
  'num_samples': 152640,
  'gender': 'MALE'},
 {'id': 1873,
  'file_name': '13475286188810937584.wav',
  'raw_transcription': '拒绝男人时要坚定,别害怕坚持自己的立场(不管文化有无差异,都要果断回绝!)。',
  'transcription': '拒 绝 男 人 时 要 坚 定 别 害 怕 坚 持 自 己 的 立 场 不 管 文 化 有 无 差 异 都 要 果 断 回 绝',
  '_': '拒 | 绝 | 男 | 人 | 时 | 要 | 坚 | 定 | 别 | 害 | 怕 | 坚 | 持 | 自 | 己 | 的 | 立 | 场 | 不 | 管 | 文 | 化 | 有 | 无 | 差 | 异 | 都 | 要 | 果 | 断 | 回 | 绝 |',
  'num_samples': 168640,
  'gender': 'MALE'},
 {'id': 1734,
  'file_name': '10056338555786085046.wav',
  'raw_transcription': '科学家们可以得出结论,暗物质对其他暗物质的影响方式与普通物质相同。',
  'transcription': '科 学 家 们 可 以 得 出 结 论 暗 物 质 对 其 他 暗 物 质 的 影 响 方 式 与 普 通 物 质 相 同',
  '_': '科 | 学 | 家 | 们 | 可 | 以 | 得 | 出 | 结 | 论 | 暗 | 物 | 质 | 对 | 其 | 他 | 暗 | 物 | 质 | 的 | 影 | 响 | 方 | 式 | 与 | 普 | 通 | 物 | 质 | 相 | 同 |',
  'num_samples': 206400,
  'gender': 'MALE'},
 {'id': 1734,
  'file_name': '9437541650035361628.wav',
  'raw_transcription': '科学家们可以得出结论,暗物质对其他暗物质的影响方式与普通物质相同。',
  'transcription': '科 学 家 们 可 以 得 出 结 论 暗 物 质 对 其 他 暗 物 质 的 影 响 方 式 与 普 通 物 质 相 同',
  '_': '科 | 学 | 家 | 们 | 可 | 以 | 得 | 出 | 结 | 论 | 暗 | 物 | 质 | 对 | 其 | 他 | 暗 | 物 | 质 | 的 | 影 | 响 | 方 | 式 | 与 | 普 | 通 | 物 | 质 | 相 | 同 |',
  'num_samples': 171200,
  'gender': 'MALE'},
 {'id': 1734,
  'file_name': '6007266430776623229.wav',
  'raw_transcription': '科学家们可以得出结论,暗物质对其他暗物质的影响方式与普通物质相同。',
  'transcription': '科 学 家 们 可 以 得 出 结 论 暗 物 质 对 其 他 暗 物 质 的 影 响 方 式 与 普 通 物 质 相 同',
  '_': '科 | 学 | 家 | 们 | 可 | 以 | 得 | 出 | 结 | 论 | 暗 | 物 | 质 | 对 | 其 | 他 | 暗 | 物 | 质 | 的 | 影 | 响 | 方 | 式 | 与 | 普 | 通 | 物 | 质 | 相 | 同 |',
  'num_samples': 105600,
  'gender': 'FEMALE'},
 {'id': 1666,
  'file_name': '11031078104467854733.wav',
  'raw_transcription': '你也可以咨询除贵国以外其他政府的建议,但他们的建议是为他们的公民而制定的。',
  'transcription': '你 也 可 以 咨 询 除 贵 国 以 外 其 他 政 府 的 建 议 但 他 们 的 建 议 是 为 他 们 的 公 民 而 制 定 的',
  '_': '你 | 也 | 可 | 以 | 咨 | 询 | 除 | 贵 | 国 | 以 | 外 | 其 | 他 | 政 | 府 | 的 | 建 | 议 | 但 | 他 | 们 | 的 | 建 | 议 | 是 | 为 | 他 | 们 | 的 | 公 | 民 | 而 | 制 | 定 | 的 |',
  'num_samples': 130560,
  'gender': 'FEMALE'},
 {'id': 1666,
  'file_name': '8073402329452840337.wav',
  'raw_transcription': '你也可以咨询除贵国以外其他政府的建议,但他们的建议是为他们的公民而制定的。',
  'transcription': '你 也 可 以 咨 询 除 贵 国 以 外 其 他 政 府 的 建 议 但 他 们 的 建 议 是 为 他 们 的 公 民 而 制 定 的',
  '_': '你 | 也 | 可 | 以 | 咨 | 询 | 除 | 贵 | 国 | 以 | 外 | 其 | 他 | 政 | 府 | 的 | 建 | 议 | 但 | 他 | 们 | 的 | 建 | 议 | 是 | 为 | 他 | 们 | 的 | 公 | 民 | 而 | 制 | 定 | 的 |',
  'num_samples': 115200,
  'gender': 'FEMALE'},
 {'id': 1666,
  'file_name': '7215241680057557029.wav',
  'raw_transcription': '你也可以咨询除贵国以外其他政府的建议,但他们的建议是为他们的公民而制定的。',
  'transcription': '你 也 可 以 咨 询 除 贵 国 以 外 其 他 政 府 的 建 议 但 他 们 的 建 议 是 为 他 们 的 公 民 而 制 定 的',
  '_': '你 | 也 | 可 | 以 | 咨 | 询 | 除 | 贵 | 国 | 以 | 外 | 其 | 他 | 政 | 府 | 的 | 建 | 议 | 但 | 他 | 们 | 的 | 建 | 议 | 是 | 为 | 他 | 们 | 的 | 公 | 民 | 而 | 制 | 定 | 的 |',
  'num_samples': 114240,
  'gender': 'FEMALE'},
 {'id': 1978,
  'file_name': '12468616230813982354.wav',
  'raw_transcription': '跳羚队以五连败收官。',
  'transcription': '跳 羚 队 以 五 连 败 收 官',
  '_': '跳 | 羚 | 队 | 以 | 五 | 连 | 败 | 收 | 官 |',
  'num_samples': 107840,
  'gender': 'MALE'},
 {'id': 1978,
  'file_name': '13426858910572809574.wav',
  'raw_transcription': '跳羚队以五连败收官。',
  'transcription': '跳 羚 队 以 五 连 败 收 官',
  '_': '跳 | 羚 | 队 | 以 | 五 | 连 | 败 | 收 | 官 |',
  'num_samples': 117440,
  'gender': 'MALE'},
 {'id': 1978,
  'file_name': '18157050711674607849.wav',
  'raw_transcription': '跳羚队以五连败收官。',
  'transcription': '跳 羚 队 以 五 连 败 收 官',
  '_': '跳 | 羚 | 队 | 以 | 五 | 连 | 败 | 收 | 官 |',
  'num_samples': 142080,
  'gender': 'MALE'},
 {'id': 1919,
  'file_name': '5476954880054248968.wav',
  'raw_transcription': '这座城市也是攀登尼拉贡戈火山(Nyiragongo)以及非洲最便宜的山地大猩猩追踪项目的基地。',
  'transcription': '这 座 城 市 也 是 攀 登 尼 拉 贡 戈 火 山 nyiragongo 以 及 非 洲 最 便 宜 的 山 地 大 猩 猩 追 踪 项 目 的 基 地',
  '_': '这 | 座 | 城 | 市 | 也 | 是 | 攀 | 登 | 尼 | 拉 | 贡 | 戈 | 火 | 山 | n y i r a g o n g o | 以 | 及 | 非 | 洲 | 最 | 便 | 宜 | 的 | 山 | 地 | 大 | 猩 | 猩 | 追 | 踪 | 项 | 目 | 的 | 基 | 地 |',
  'num_samples': 192000,
  'gender': 'MALE'},
 {'id': 1919,
  'file_name': '5359218493314493777.wav',
  'raw_transcription': '这座城市也是攀登尼拉贡戈火山(Nyiragongo)以及非洲最便宜的山地大猩猩追踪项目的基地。',
  'transcription': '这 座 城 市 也 是 攀 登 尼 拉 贡 戈 火 山 nyiragongo 以 及 非 洲 最 便 宜 的 山 地 大 猩 猩 追 踪 项 目 的 基 地',
  '_': '这 | 座 | 城 | 市 | 也 | 是 | 攀 | 登 | 尼 | 拉 | 贡 | 戈 | 火 | 山 | n y i r a g o n g o | 以 | 及 | 非 | 洲 | 最 | 便 | 宜 | 的 | 山 | 地 | 大 | 猩 | 猩 | 追 | 踪 | 项 | 目 | 的 | 基 | 地 |',
  'num_samples': 150720,
  'gender': 'MALE'},
 {'id': 1919,
  'file_name': '9853448135009496348.wav',
  'raw_transcription': '这座城市也是攀登尼拉贡戈火山(Nyiragongo)以及非洲最便宜的山地大猩猩追踪项目的基地。',
  'transcription': '这 座 城 市 也 是 攀 登 尼 拉 贡 戈 火 山 nyiragongo 以 及 非 洲 最 便 宜 的 山 地 大 猩 猩 追 踪 项 目 的 基 地',
  '_': '这 | 座 | 城 | 市 | 也 | 是 | 攀 | 登 | 尼 | 拉 | 贡 | 戈 | 火 | 山 | n y i r a g o n g o | 以 | 及 | 非 | 洲 | 最 | 便 | 宜 | 的 | 山 | 地 | 大 | 猩 | 猩 | 追 | 踪 | 项 | 目 | 的 | 基 | 地 |',
  'num_samples': 187200,
  'gender': 'MALE'},
 {'id': 1883,
  'file_name': '6493157281990579385.wav',
  'raw_transcription': '桥下垂直净空 15 米。该项目于 2011 年 8 月完工,但直到 2017 年 3 月才开始通车。',
  'transcription': '桥 下 垂 直 净 空 15 米 该 项 目 于 2011 年 8 月 完 工 但 直 到 2017 年 3 月 才 开 始 通 车',
  '_': '桥 | 下 | 垂 | 直 | 净 | 空 | 1 5 | 米 | 该 | 项 | 目 | 于 | 2 0 1 1 | 年 | 8 | 月 | 完 | 工 | 但 | 直 | 到 | 2 0 1 7 | 年 | 3 | 月 | 才 | 开 | 始 | 通 | 车 |',
  'num_samples': 148800,
  'gender': 'FEMALE'},
 {'id': 1883,
  'file_name': '8387563482214137109.wav',
  'raw_transcription': '桥下垂直净空 15 米。该项目于 2011 年 8 月完工,但直到 2017 年 3 月才开始通车。',
  'transcription': '桥 下 垂 直 净 空 15 米 该 项 目 于 2011 年 8 月 完 工 但 直 到 2017 年 3 月 才 开 始 通 车',
  '_': '桥 | 下 | 垂 | 直 | 净 | 空 | 1 5 | 米 | 该 | 项 | 目 | 于 | 2 0 1 1 | 年 | 8 | 月 | 完 | 工 | 但 | 直 | 到 | 2 0 1 7 | 年 | 3 | 月 | 才 | 开 | 始 | 通 | 车 |',
  'num_samples': 217280,
  'gender': 'MALE'},
 {'id': 1883,
  'file_name': '10048525650290665384.wav',
  'raw_transcription': '桥下垂直净空 15 米。该项目于 2011 年 8 月完工,但直到 2017 年 3 月才开始通车。',
  'transcription': '桥 下 垂 直 净 空 15 米 该 项 目 于 2011 年 8 月 完 工 但 直 到 2017 年 3 月 才 开 始 通 车',
  '_': '桥 | 下 | 垂 | 直 | 净 | 空 | 1 5 | 米 | 该 | 项 | 目 | 于 | 2 0 1 1 | 年 | 8 | 月 | 完 | 工 | 但 | 直 | 到 | 2 0 1 7 | 年 | 3 | 月 | 才 | 开 | 始 | 通 | 车 |',
  'num_samples': 221760,
  'gender': 'MALE'},
 {'id': 1846,
  'file_name': '9519471631565549023.wav',
  'raw_transcription': '因此,这种格式的宽高比(除以 12 得到最简单的整数比)便是 3:2。',
  'transcription': '因 此 这 种 格 式 的 宽 高 比 除 以 12 得 到 最 简 单 的 整 数 比 便 是 3:2',
  '_': '因 | 此 | 这 | 种 | 格 | 式 | 的 | 宽 | 高 | 比 | 除 | 以 | 1 2 | 得 | 到 | 最 | 简 | 单 | 的 | 整 | 数 | 比 | 便 | 是 | 3 : 2 |',
  'num_samples': 194240,
  'gender': 'MALE'},
 {'id': 1846,
  'file_name': '4257103846657058014.wav',
  'raw_transcription': '因此,这种格式的宽高比(除以 12 得到最简单的整数比)便是 3:2。',
  'transcription': '因 此 这 种 格 式 的 宽 高 比 除 以 12 得 到 最 简 单 的 整 数 比 便 是 3:2',
  '_': '因 | 此 | 这 | 种 | 格 | 式 | 的 | 宽 | 高 | 比 | 除 | 以 | 1 2 | 得 | 到 | 最 | 简 | 单 | 的 | 整 | 数 | 比 | 便 | 是 | 3 : 2 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 1846,
  'file_name': '17546516531796753426.wav',
  'raw_transcription': '因此,这种格式的宽高比(除以 12 得到最简单的整数比)便是 3:2。',
  'transcription': '因 此 这 种 格 式 的 宽 高 比 除 以 12 得 到 最 简 单 的 整 数 比 便 是 3:2',
  '_': '因 | 此 | 这 | 种 | 格 | 式 | 的 | 宽 | 高 | 比 | 除 | 以 | 1 2 | 得 | 到 | 最 | 简 | 单 | 的 | 整 | 数 | 比 | 便 | 是 | 3 : 2 |',
  'num_samples': 184000,
  'gender': 'MALE'},
 {'id': 1737,
  'file_name': '17084587270054163808.wav',
  'raw_transcription': '狮子是群居属性最明显的猫科动物,生活在称为狮群的大型群体中。',
  'transcription': '狮 子 是 群 居 属 性 最 明 显 的 猫 科 动 物 生 活 在 称 为 狮 群 的 大 型 群 体 中',
  '_': '狮 | 子 | 是 | 群 | 居 | 属 | 性 | 最 | 明 | 显 | 的 | 猫 | 科 | 动 | 物 | 生 | 活 | 在 | 称 | 为 | 狮 | 群 | 的 | 大 | 型 | 群 | 体 | 中 |',
  'num_samples': 212480,
  'gender': 'MALE'},
 {'id': 1737,
  'file_name': '9250926933121719212.wav',
  'raw_transcription': '狮子是群居属性最明显的猫科动物,生活在称为狮群的大型群体中。',
  'transcription': '狮 子 是 群 居 属 性 最 明 显 的 猫 科 动 物 生 活 在 称 为 狮 群 的 大 型 群 体 中',
  '_': '狮 | 子 | 是 | 群 | 居 | 属 | 性 | 最 | 明 | 显 | 的 | 猫 | 科 | 动 | 物 | 生 | 活 | 在 | 称 | 为 | 狮 | 群 | 的 | 大 | 型 | 群 | 体 | 中 |',
  'num_samples': 196800,
  'gender': 'MALE'},
 {'id': 1737,
  'file_name': '12786970078768203750.wav',
  'raw_transcription': '狮子是群居属性最明显的猫科动物,生活在称为狮群的大型群体中。',
  'transcription': '狮 子 是 群 居 属 性 最 明 显 的 猫 科 动 物 生 活 在 称 为 狮 群 的 大 型 群 体 中',
  '_': '狮 | 子 | 是 | 群 | 居 | 属 | 性 | 最 | 明 | 显 | 的 | 猫 | 科 | 动 | 物 | 生 | 活 | 在 | 称 | 为 | 狮 | 群 | 的 | 大 | 型 | 群 | 体 | 中 |',
  'num_samples': 129600,
  'gender': 'FEMALE'},
 {'id': 1966,
  'file_name': '4010462455058470974.wav',
  'raw_transcription': '该委员会是马尔泰利 (Martelly) 对始于 10 月份的大规模反政府抗议活动做出的回应。',
  'transcription': '该 委 员 会 是 马 尔 泰 利 martelly 对 始 于 10 月 份 的 大 规 模 反 政 府 抗 议 活 动 做 出 的 回 应',
  '_': '该 | 委 | 员 | 会 | 是 | 马 | 尔 | 泰 | 利 | m a r t e l l y | 对 | 始 | 于 | 1 0 | 月 | 份 | 的 | 大 | 规 | 模 | 反 | 政 | 府 | 抗 | 议 | 活 | 动 | 做 | 出 | 的 | 回 | 应 |',
  'num_samples': 246080,
  'gender': 'MALE'},
 {'id': 1966,
  'file_name': '2193872380564535396.wav',
  'raw_transcription': '该委员会是马尔泰利 (Martelly) 对始于 10 月份的大规模反政府抗议活动做出的回应。',
  'transcription': '该 委 员 会 是 马 尔 泰 利 martelly 对 始 于 10 月 份 的 大 规 模 反 政 府 抗 议 活 动 做 出 的 回 应',
  '_': '该 | 委 | 员 | 会 | 是 | 马 | 尔 | 泰 | 利 | m a r t e l l y | 对 | 始 | 于 | 1 0 | 月 | 份 | 的 | 大 | 规 | 模 | 反 | 政 | 府 | 抗 | 议 | 活 | 动 | 做 | 出 | 的 | 回 | 应 |',
  'num_samples': 215360,
  'gender': 'MALE'},
 {'id': 1966,
  'file_name': '7551043321789051642.wav',
  'raw_transcription': '该委员会是马尔泰利 (Martelly) 对始于 10 月份的大规模反政府抗议活动做出的回应。',
  'transcription': '该 委 员 会 是 马 尔 泰 利 martelly 对 始 于 10 月 份 的 大 规 模 反 政 府 抗 议 活 动 做 出 的 回 应',
  '_': '该 | 委 | 员 | 会 | 是 | 马 | 尔 | 泰 | 利 | m a r t e l l y | 对 | 始 | 于 | 1 0 | 月 | 份 | 的 | 大 | 规 | 模 | 反 | 政 | 府 | 抗 | 议 | 活 | 动 | 做 | 出 | 的 | 回 | 应 |',
  'num_samples': 152640,
  'gender': 'MALE'},
 {'id': 1929,
  'file_name': '12904500939659924193.wav',
  'raw_transcription': '德尔·波特罗(Del Potro)在第二盘刚开局时就占上风,但在比分达到 6-6 后就得进行抢七大战。',
  'transcription': '德 尔 波 特 罗 del potro 在 第 二 盘 刚 开 局 时 就 占 上 风 但 在 比 分 达 到 6-6 后 就 得 进 行 抢 七 大 战',
  '_': '德 | 尔 | 波 | 特 | 罗 | d e l | p o t r o | 在 | 第 | 二 | 盘 | 刚 | 开 | 局 | 时 | 就 | 占 | 上 | 风 | 但 | 在 | 比 | 分 | 达 | 到 | 6 - 6 | 后 | 就 | 得 | 进 | 行 | 抢 | 七 | 大 | 战 |',
  'num_samples': 249600,
  'gender': 'MALE'},
 {'id': 1929,
  'file_name': '11054147385689090819.wav',
  'raw_transcription': '德尔·波特罗(Del Potro)在第二盘刚开局时就占上风,但在比分达到 6-6 后就得进行抢七大战。',
  'transcription': '德 尔 波 特 罗 del potro 在 第 二 盘 刚 开 局 时 就 占 上 风 但 在 比 分 达 到 6-6 后 就 得 进 行 抢 七 大 战',
  '_': '德 | 尔 | 波 | 特 | 罗 | d e l | p o t r o | 在 | 第 | 二 | 盘 | 刚 | 开 | 局 | 时 | 就 | 占 | 上 | 风 | 但 | 在 | 比 | 分 | 达 | 到 | 6 - 6 | 后 | 就 | 得 | 进 | 行 | 抢 | 七 | 大 | 战 |',
  'num_samples': 288000,
  'gender': 'MALE'},
 {'id': 1875,
  'file_name': '15258562900597652653.wav',
  'raw_transcription': '亚马逊河占全世界所有河流的入海流量的 20%。',
  'transcription': '亚 马 逊 河 占 全 世 界 所 有 河 流 的 入 海 流 量 的 20%',
  '_': '亚 | 马 | 逊 | 河 | 占 | 全 | 世 | 界 | 所 | 有 | 河 | 流 | 的 | 入 | 海 | 流 | 量 | 的 | 2 0 % |',
  'num_samples': 126720,
  'gender': 'MALE'},
 {'id': 1875,
  'file_name': '5954160595449761450.wav',
  'raw_transcription': '亚马逊河占全世界所有河流的入海流量的 20%。',
  'transcription': '亚 马 逊 河 占 全 世 界 所 有 河 流 的 入 海 流 量 的 20%',
  '_': '亚 | 马 | 逊 | 河 | 占 | 全 | 世 | 界 | 所 | 有 | 河 | 流 | 的 | 入 | 海 | 流 | 量 | 的 | 2 0 % |',
  'num_samples': 84480,
  'gender': 'FEMALE'},
 {'id': 1875,
  'file_name': '4029647781917512535.wav',
  'raw_transcription': '亚马逊河占全世界所有河流的入海流量的 20%。',
  'transcription': '亚 马 逊 河 占 全 世 界 所 有 河 流 的 入 海 流 量 的 20%',
  '_': '亚 | 马 | 逊 | 河 | 占 | 全 | 世 | 界 | 所 | 有 | 河 | 流 | 的 | 入 | 海 | 流 | 量 | 的 | 2 0 % |',
  'num_samples': 143040,
  'gender': 'MALE'},
 {'id': 1692,
  'file_name': '17639585860488007329.wav',
  'raw_transcription': '日本原子能机构表示,核电站检测出了放射性物质铯和碘。',
  'transcription': '日 本 原 子 能 机 构 表 示 核 电 站 检 测 出 了 放 射 性 物 质 铯 和 碘',
  '_': '日 | 本 | 原 | 子 | 能 | 机 | 构 | 表 | 示 | 核 | 电 | 站 | 检 | 测 | 出 | 了 | 放 | 射 | 性 | 物 | 质 | 铯 | 和 | 碘 |',
  'num_samples': 176000,
  'gender': 'MALE'},
 {'id': 1909,
  'file_name': '15550211393496644769.wav',
  'raw_transcription': '虚拟团队需要坚持与传统团队同样的质量标准,但也有细微的差别。',
  'transcription': '虚 拟 团 队 需 要 坚 持 与 传 统 团 队 同 样 的 质 量 标 准 但 也 有 细 微 的 差 别',
  '_': '虚 | 拟 | 团 | 队 | 需 | 要 | 坚 | 持 | 与 | 传 | 统 | 团 | 队 | 同 | 样 | 的 | 质 | 量 | 标 | 准 | 但 | 也 | 有 | 细 | 微 | 的 | 差 | 别 |',
  'num_samples': 154560,
  'gender': 'MALE'},
 {'id': 1909,
  'file_name': '9164262831491631784.wav',
  'raw_transcription': '虚拟团队需要坚持与传统团队同样的质量标准,但也有细微的差别。',
  'transcription': '虚 拟 团 队 需 要 坚 持 与 传 统 团 队 同 样 的 质 量 标 准 但 也 有 细 微 的 差 别',
  '_': '虚 | 拟 | 团 | 队 | 需 | 要 | 坚 | 持 | 与 | 传 | 统 | 团 | 队 | 同 | 样 | 的 | 质 | 量 | 标 | 准 | 但 | 也 | 有 | 细 | 微 | 的 | 差 | 别 |',
  'num_samples': 187200,
  'gender': 'MALE'},
 {'id': 1909,
  'file_name': '7442542662425587139.wav',
  'raw_transcription': '虚拟团队需要坚持与传统团队同样的质量标准,但也有细微的差别。',
  'transcription': '虚 拟 团 队 需 要 坚 持 与 传 统 团 队 同 样 的 质 量 标 准 但 也 有 细 微 的 差 别',
  '_': '虚 | 拟 | 团 | 队 | 需 | 要 | 坚 | 持 | 与 | 传 | 统 | 团 | 队 | 同 | 样 | 的 | 质 | 量 | 标 | 准 | 但 | 也 | 有 | 细 | 微 | 的 | 差 | 别 |',
  'num_samples': 99840,
  'gender': 'FEMALE'},
 {'id': 1818,
  'file_name': '6121055890864018747.wav',
  'raw_transcription': '人们可能想不到,旅行者在回程中也需要耐心和理解。',
  'transcription': '人 们 可 能 想 不 到 旅 行 者 在 回 程 中 也 需 要 耐 心 和 理 解',
  '_': '人 | 们 | 可 | 能 | 想 | 不 | 到 | 旅 | 行 | 者 | 在 | 回 | 程 | 中 | 也 | 需 | 要 | 耐 | 心 | 和 | 理 | 解 |',
  'num_samples': 173440,
  'gender': 'MALE'},
 {'id': 1818,
  'file_name': '16365859578166913127.wav',
  'raw_transcription': '人们可能想不到,旅行者在回程中也需要耐心和理解。',
  'transcription': '人 们 可 能 想 不 到 旅 行 者 在 回 程 中 也 需 要 耐 心 和 理 解',
  '_': '人 | 们 | 可 | 能 | 想 | 不 | 到 | 旅 | 行 | 者 | 在 | 回 | 程 | 中 | 也 | 需 | 要 | 耐 | 心 | 和 | 理 | 解 |',
  'num_samples': 126720,
  'gender': 'MALE'},
 {'id': 1818,
  'file_name': '7208321975419226278.wav',
  'raw_transcription': '人们可能想不到,旅行者在回程中也需要耐心和理解。',
  'transcription': '人 们 可 能 想 不 到 旅 行 者 在 回 程 中 也 需 要 耐 心 和 理 解',
  '_': '人 | 们 | 可 | 能 | 想 | 不 | 到 | 旅 | 行 | 者 | 在 | 回 | 程 | 中 | 也 | 需 | 要 | 耐 | 心 | 和 | 理 | 解 |',
  'num_samples': 134400,
  'gender': 'MALE'},
 {'id': 1967,
  'file_name': '4831286604622294904.wav',
  'raw_transcription': '“莱顿 (Layton) 在与首相会面期间要求修改保守党的环境法案,他要求‘彻底重写’保守党的环境法案。”',
  'transcription': "莱 顿 layton 在 与 首 相 会 面 期 间 要 求 修 改 保 守 党 的 环 境 法 案 他 要 求 ' 彻 底 重 写 ' 保 守 党 的 环 境 法 案",
  '_': "莱 | 顿 | l a y t o n | 在 | 与 | 首 | 相 | 会 | 面 | 期 | 间 | 要 | 求 | 修 | 改 | 保 | 守 | 党 | 的 | 环 | 境 | 法 | 案 | 他 | 要 | 求 | ' | 彻 | 底 | 重 | 写 | ' | 保 | 守 | 党 | 的 | 环 | 境 | 法 | 案 |",
  'num_samples': 216320,
  'gender': 'MALE'},
 {'id': 1967,
  'file_name': '14573386047812143137.wav',
  'raw_transcription': '“莱顿 (Layton) 在与首相会面期间要求修改保守党的环境法案,他要求‘彻底重写’保守党的环境法案。”',
  'transcription': "莱 顿 layton 在 与 首 相 会 面 期 间 要 求 修 改 保 守 党 的 环 境 法 案 他 要 求 ' 彻 底 重 写 ' 保 守 党 的 环 境 法 案",
  '_': "莱 | 顿 | l a y t o n | 在 | 与 | 首 | 相 | 会 | 面 | 期 | 间 | 要 | 求 | 修 | 改 | 保 | 守 | 党 | 的 | 环 | 境 | 法 | 案 | 他 | 要 | 求 | ' | 彻 | 底 | 重 | 写 | ' | 保 | 守 | 党 | 的 | 环 | 境 | 法 | 案 |",
  'num_samples': 165120,
  'gender': 'MALE'},
 {'id': 1940,
  'file_name': '14668767792184526546.wav',
  'raw_transcription': '综上所述,如果我们的祖先解决“蛋白质问题”的途径与如今热带草原上的黑猩猩所使用的方法无异,我们也不应该感到惊讶。',
  'transcription': '综 上 所 述 如 果 我 们 的 祖 先 解 决 蛋 白 质 问 题 的 途 径 与 如 今 热 带 草 原 上 的 黑 猩 猩 所 使 用 的 方 法 无 异 我 们 也 不 应 该 感 到 惊 讶',
  '_': '综 | 上 | 所 | 述 | 如 | 果 | 我 | 们 | 的 | 祖 | 先 | 解 | 决 | 蛋 | 白 | 质 | 问 | 题 | 的 | 途 | 径 | 与 | 如 | 今 | 热 | 带 | 草 | 原 | 上 | 的 | 黑 | 猩 | 猩 | 所 | 使 | 用 | 的 | 方 | 法 | 无 | 异 | 我 | 们 | 也 | 不 | 应 | 该 | 感 | 到 | 惊 | 讶 |',
  'num_samples': 169920,
  'gender': 'FEMALE'},
 {'id': 1940,
  'file_name': '5210493485648228540.wav',
  'raw_transcription': '综上所述,如果我们的祖先解决“蛋白质问题”的途径与如今热带草原上的黑猩猩所使用的方法无异,我们也不应该感到惊讶。',
  'transcription': '综 上 所 述 如 果 我 们 的 祖 先 解 决 蛋 白 质 问 题 的 途 径 与 如 今 热 带 草 原 上 的 黑 猩 猩 所 使 用 的 方 法 无 异 我 们 也 不 应 该 感 到 惊 讶',
  '_': '综 | 上 | 所 | 述 | 如 | 果 | 我 | 们 | 的 | 祖 | 先 | 解 | 决 | 蛋 | 白 | 质 | 问 | 题 | 的 | 途 | 径 | 与 | 如 | 今 | 热 | 带 | 草 | 原 | 上 | 的 | 黑 | 猩 | 猩 | 所 | 使 | 用 | 的 | 方 | 法 | 无 | 异 | 我 | 们 | 也 | 不 | 应 | 该 | 感 | 到 | 惊 | 讶 |',
  'num_samples': 234240,
  'gender': 'MALE'},
 {'id': 1940,
  'file_name': '13574931655876528840.wav',
  'raw_transcription': '综上所述,如果我们的祖先解决“蛋白质问题”的途径与如今热带草原上的黑猩猩所使用的方法无异,我们也不应该感到惊讶。',
  'transcription': '综 上 所 述 如 果 我 们 的 祖 先 解 决 蛋 白 质 问 题 的 途 径 与 如 今 热 带 草 原 上 的 黑 猩 猩 所 使 用 的 方 法 无 异 我 们 也 不 应 该 感 到 惊 讶',
  '_': '综 | 上 | 所 | 述 | 如 | 果 | 我 | 们 | 的 | 祖 | 先 | 解 | 决 | 蛋 | 白 | 质 | 问 | 题 | 的 | 途 | 径 | 与 | 如 | 今 | 热 | 带 | 草 | 原 | 上 | 的 | 黑 | 猩 | 猩 | 所 | 使 | 用 | 的 | 方 | 法 | 无 | 异 | 我 | 们 | 也 | 不 | 应 | 该 | 感 | 到 | 惊 | 讶 |',
  'num_samples': 219840,
  'gender': 'MALE'},
 {'id': 1778,
  'file_name': '12108726579659517297.wav',
  'raw_transcription': '电视报道显示,有白烟从工厂里冒出。',
  'transcription': '电 视 报 道 显 示 有 白 烟 从 工 厂 里 冒 出',
  '_': '电 | 视 | 报 | 道 | 显 | 示 | 有 | 白 | 烟 | 从 | 工 | 厂 | 里 | 冒 | 出 |',
  'num_samples': 77760,
  'gender': 'FEMALE'},
 {'id': 1778,
  'file_name': '6416022517981090294.wav',
  'raw_transcription': '电视报道显示,有白烟从工厂里冒出。',
  'transcription': '电 视 报 道 显 示 有 白 烟 从 工 厂 里 冒 出',
  '_': '电 | 视 | 报 | 道 | 显 | 示 | 有 | 白 | 烟 | 从 | 工 | 厂 | 里 | 冒 | 出 |',
  'num_samples': 99840,
  'gender': 'MALE'},
 {'id': 1778,
  'file_name': '3637815542348192629.wav',
  'raw_transcription': '电视报道显示,有白烟从工厂里冒出。',
  'transcription': '电 视 报 道 显 示 有 白 烟 从 工 厂 里 冒 出',
  '_': '电 | 视 | 报 | 道 | 显 | 示 | 有 | 白 | 烟 | 从 | 工 | 厂 | 里 | 冒 | 出 |',
  'num_samples': 97920,
  'gender': 'MALE'},
 {'id': 1762,
  'file_name': '2367286864389832748.wav',
  'raw_transcription': '猪携带该疾病,然后通过蚊子传染给人类。',
  'transcription': '猪 携 带 该 疾 病 然 后 通 过 蚊 子 传 染 给 人 类',
  '_': '猪 | 携 | 带 | 该 | 疾 | 病 | 然 | 后 | 通 | 过 | 蚊 | 子 | 传 | 染 | 给 | 人 | 类 |',
  'num_samples': 180160,
  'gender': 'MALE'},
 {'id': 1762,
  'file_name': '4538998662723179004.wav',
  'raw_transcription': '猪携带该疾病,然后通过蚊子传染给人类。',
  'transcription': '猪 携 带 该 疾 病 然 后 通 过 蚊 子 传 染 给 人 类',
  '_': '猪 | 携 | 带 | 该 | 疾 | 病 | 然 | 后 | 通 | 过 | 蚊 | 子 | 传 | 染 | 给 | 人 | 类 |',
  'num_samples': 69120,
  'gender': 'FEMALE'},
 {'id': 1762,
  'file_name': '13308557719050197251.wav',
  'raw_transcription': '猪携带该疾病,然后通过蚊子传染给人类。',
  'transcription': '猪 携 带 该 疾 病 然 后 通 过 蚊 子 传 染 给 人 类',
  '_': '猪 | 携 | 带 | 该 | 疾 | 病 | 然 | 后 | 通 | 过 | 蚊 | 子 | 传 | 染 | 给 | 人 | 类 |',
  'num_samples': 194560,
  'gender': 'MALE'},
 {'id': 1852,
  'file_name': '9401374422679378543.wav',
  'raw_transcription': '适当使用博客,可以使学生变得更善于分析和进行思辨;通过积极回应网络材料,学生们可以在他人文章的上下文语境中找到自己的立场,并能够针对特定问题提出自己的观点(Oravec, 2002)。"',
  'transcription': '适 当 使 用 博 客 可 以 使 学 生 变 得 更 善 于 分 析 和 进 行 思 辨 通 过 积 极 回 应 网 络 材 料 学 生 们 可 以 在 他 人 文 章 的 上 下 文 语 境 中 找 到 自 己 的 立 场 并 能 够 针 对 特 定 问 题 提 出 自 己 的 观 点 oravec 2002',
  '_': '适 | 当 | 使 | 用 | 博 | 客 | 可 | 以 | 使 | 学 | 生 | 变 | 得 | 更 | 善 | 于 | 分 | 析 | 和 | 进 | 行 | 思 | 辨 | 通 | 过 | 积 | 极 | 回 | 应 | 网 | 络 | 材 | 料 | 学 | 生 | 们 | 可 | 以 | 在 | 他 | 人 | 文 | 章 | 的 | 上 | 下 | 文 | 语 | 境 | 中 | 找 | 到 | 自 | 己 | 的 | 立 | 场 | 并 | 能 | 够 | 针 | 对 | 特 | 定 | 问 | 题 | 提 | 出 | 自 | 己 | 的 | 观 | 点 | o r a v e c | 2 0 0 2 |',
  'num_samples': 271680,
  'gender': 'FEMALE'},
 {'id': 1852,
  'file_name': '10053956375630517392.wav',
  'raw_transcription': '适当使用博客,可以使学生变得更善于分析和进行思辨;通过积极回应网络材料,学生们可以在他人文章的上下文语境中找到自己的立场,并能够针对特定问题提出自己的观点(Oravec, 2002)。"',
  'transcription': '适 当 使 用 博 客 可 以 使 学 生 变 得 更 善 于 分 析 和 进 行 思 辨 通 过 积 极 回 应 网 络 材 料 学 生 们 可 以 在 他 人 文 章 的 上 下 文 语 境 中 找 到 自 己 的 立 场 并 能 够 针 对 特 定 问 题 提 出 自 己 的 观 点 oravec 2002',
  '_': '适 | 当 | 使 | 用 | 博 | 客 | 可 | 以 | 使 | 学 | 生 | 变 | 得 | 更 | 善 | 于 | 分 | 析 | 和 | 进 | 行 | 思 | 辨 | 通 | 过 | 积 | 极 | 回 | 应 | 网 | 络 | 材 | 料 | 学 | 生 | 们 | 可 | 以 | 在 | 他 | 人 | 文 | 章 | 的 | 上 | 下 | 文 | 语 | 境 | 中 | 找 | 到 | 自 | 己 | 的 | 立 | 场 | 并 | 能 | 够 | 针 | 对 | 特 | 定 | 问 | 题 | 提 | 出 | 自 | 己 | 的 | 观 | 点 | o r a v e c | 2 0 0 2 |',
  'num_samples': 246720,
  'gender': 'FEMALE'},
 {'id': 1852,
  'file_name': '9149551687655385257.wav',
  'raw_transcription': '适当使用博客,可以使学生变得更善于分析和进行思辨;通过积极回应网络材料,学生们可以在他人文章的上下文语境中找到自己的立场,并能够针对特定问题提出自己的观点(Oravec, 2002)。"',
  'transcription': '适 当 使 用 博 客 可 以 使 学 生 变 得 更 善 于 分 析 和 进 行 思 辨 通 过 积 极 回 应 网 络 材 料 学 生 们 可 以 在 他 人 文 章 的 上 下 文 语 境 中 找 到 自 己 的 立 场 并 能 够 针 对 特 定 问 题 提 出 自 己 的 观 点 oravec 2002',
  '_': '适 | 当 | 使 | 用 | 博 | 客 | 可 | 以 | 使 | 学 | 生 | 变 | 得 | 更 | 善 | 于 | 分 | 析 | 和 | 进 | 行 | 思 | 辨 | 通 | 过 | 积 | 极 | 回 | 应 | 网 | 络 | 材 | 料 | 学 | 生 | 们 | 可 | 以 | 在 | 他 | 人 | 文 | 章 | 的 | 上 | 下 | 文 | 语 | 境 | 中 | 找 | 到 | 自 | 己 | 的 | 立 | 场 | 并 | 能 | 够 | 针 | 对 | 特 | 定 | 问 | 题 | 提 | 出 | 自 | 己 | 的 | 观 | 点 | o r a v e c | 2 0 0 2 |',
  'num_samples': 293760,
  'gender': 'MALE'},
 {'id': 1937,
  'file_name': '11278675788774853859.wav',
  'raw_transcription': '然而,这些计划几乎在一夜之间被弃如敝履,在违反《里加和平条约》、《苏联波兰互不侵犯条约》及其他双边及多边国际条约,入侵波兰的东部地区之后,超过 80 万名苏联红军入境,并在白俄罗斯和乌克兰筑起阵地。',
  'transcription': '然 而 这 些 计 划 几 乎 在 一 夜 之 间 被 弃 如 敝 履 在 违 反 里 加 和 平 条 约 苏 联 波 兰 互 不 侵 犯 条 约 及 其 他 双 边 及 多 边 国 际 条 约 入 侵 波 兰 的 东 部 地 区 之 后 超 过 80 万 名 苏 联 红 军 入 境 并 在 白 俄 罗 斯 和 乌 克 兰 筑 起 阵 地',
  '_': '然 | 而 | 这 | 些 | 计 | 划 | 几 | 乎 | 在 | 一 | 夜 | 之 | 间 | 被 | 弃 | 如 | 敝 | 履 | 在 | 违 | 反 | 里 | 加 | 和 | 平 | 条 | 约 | 苏 | 联 | 波 | 兰 | 互 | 不 | 侵 | 犯 | 条 | 约 | 及 | 其 | 他 | 双 | 边 | 及 | 多 | 边 | 国 | 际 | 条 | 约 | 入 | 侵 | 波 | 兰 | 的 | 东 | 部 | 地 | 区 | 之 | 后 | 超 | 过 | 8 0 | 万 | 名 | 苏 | 联 | 红 | 军 | 入 | 境 | 并 | 在 | 白 | 俄 | 罗 | 斯 | 和 | 乌 | 克 | 兰 | 筑 | 起 | 阵 | 地 |',
  'num_samples': 337920,
  'gender': 'FEMALE'},
 {'id': 1937,
  'file_name': '18282771913457226026.wav',
  'raw_transcription': '然而,这些计划几乎在一夜之间被弃如敝履,在违反《里加和平条约》、《苏联波兰互不侵犯条约》及其他双边及多边国际条约,入侵波兰的东部地区之后,超过 80 万名苏联红军入境,并在白俄罗斯和乌克兰筑起阵地。',
  'transcription': '然 而 这 些 计 划 几 乎 在 一 夜 之 间 被 弃 如 敝 履 在 违 反 里 加 和 平 条 约 苏 联 波 兰 互 不 侵 犯 条 约 及 其 他 双 边 及 多 边 国 际 条 约 入 侵 波 兰 的 东 部 地 区 之 后 超 过 80 万 名 苏 联 红 军 入 境 并 在 白 俄 罗 斯 和 乌 克 兰 筑 起 阵 地',
  '_': '然 | 而 | 这 | 些 | 计 | 划 | 几 | 乎 | 在 | 一 | 夜 | 之 | 间 | 被 | 弃 | 如 | 敝 | 履 | 在 | 违 | 反 | 里 | 加 | 和 | 平 | 条 | 约 | 苏 | 联 | 波 | 兰 | 互 | 不 | 侵 | 犯 | 条 | 约 | 及 | 其 | 他 | 双 | 边 | 及 | 多 | 边 | 国 | 际 | 条 | 约 | 入 | 侵 | 波 | 兰 | 的 | 东 | 部 | 地 | 区 | 之 | 后 | 超 | 过 | 8 0 | 万 | 名 | 苏 | 联 | 红 | 军 | 入 | 境 | 并 | 在 | 白 | 俄 | 罗 | 斯 | 和 | 乌 | 克 | 兰 | 筑 | 起 | 阵 | 地 |',
  'num_samples': 378240,
  'gender': 'MALE'},
 {'id': 1801,
  'file_name': '7738865524602908631.wav',
  'raw_transcription': '构成香港天际线的众多建筑就像是一幅闪闪发光的条形图,在维多利亚港水域的映衬下显得格外醒目。',
  'transcription': '构 成 香 港 天 际 线 的 众 多 建 筑 就 像 是 一 幅 闪 闪 发 光 的 条 形 图 在 维 多 利 亚 港 水 域 的 映 衬 下 显 得 格 外 醒 目',
  '_': '构 | 成 | 香 | 港 | 天 | 际 | 线 | 的 | 众 | 多 | 建 | 筑 | 就 | 像 | 是 | 一 | 幅 | 闪 | 闪 | 发 | 光 | 的 | 条 | 形 | 图 | 在 | 维 | 多 | 利 | 亚 | 港 | 水 | 域 | 的 | 映 | 衬 | 下 | 显 | 得 | 格 | 外 | 醒 | 目 |',
  'num_samples': 309440,
  'gender': 'MALE'},
 {'id': 1801,
  'file_name': '17985137849317254035.wav',
  'raw_transcription': '构成香港天际线的众多建筑就像是一幅闪闪发光的条形图,在维多利亚港水域的映衬下显得格外醒目。',
  'transcription': '构 成 香 港 天 际 线 的 众 多 建 筑 就 像 是 一 幅 闪 闪 发 光 的 条 形 图 在 维 多 利 亚 港 水 域 的 映 衬 下 显 得 格 外 醒 目',
  '_': '构 | 成 | 香 | 港 | 天 | 际 | 线 | 的 | 众 | 多 | 建 | 筑 | 就 | 像 | 是 | 一 | 幅 | 闪 | 闪 | 发 | 光 | 的 | 条 | 形 | 图 | 在 | 维 | 多 | 利 | 亚 | 港 | 水 | 域 | 的 | 映 | 衬 | 下 | 显 | 得 | 格 | 外 | 醒 | 目 |',
  'num_samples': 232640,
  'gender': 'MALE'},
 {'id': 1790,
  'file_name': '4682076507572177734.wav',
  'raw_transcription': '他的作品极具辨识度,拥有高质量和丰富的细节,这也使得他成为了极少数在集邮人士中“家喻户晓”的人物之一。有些人专门收集他的作品。',
  'transcription': '他 的 作 品 极 具 辨 识 度 拥 有 高 质 量 和 丰 富 的 细 节 这 也 使 得 他 成 为 了 极 少 数 在 集 邮 人 士 中 家 喻 户 晓 的 人 物 之 一 有 些 人 专 门 收 集 他 的 作 品',
  '_': '他 | 的 | 作 | 品 | 极 | 具 | 辨 | 识 | 度 | 拥 | 有 | 高 | 质 | 量 | 和 | 丰 | 富 | 的 | 细 | 节 | 这 | 也 | 使 | 得 | 他 | 成 | 为 | 了 | 极 | 少 | 数 | 在 | 集 | 邮 | 人 | 士 | 中 | 家 | 喻 | 户 | 晓 | 的 | 人 | 物 | 之 | 一 | 有 | 些 | 人 | 专 | 门 | 收 | 集 | 他 | 的 | 作 | 品 |',
  'num_samples': 314240,
  'gender': 'MALE'},
 {'id': 1757,
  'file_name': '13496083615963162782.wav',
  'raw_transcription': '只有生殖细胞的突变才会遗传给孩子,而其他细胞的突变则会导致细胞死亡或癌症。',
  'transcription': '只 有 生 殖 细 胞 的 突 变 才 会 遗 传 给 孩 子 而 其 他 细 胞 的 突 变 则 会 导 致 细 胞 死 亡 或 癌 症',
  '_': '只 | 有 | 生 | 殖 | 细 | 胞 | 的 | 突 | 变 | 才 | 会 | 遗 | 传 | 给 | 孩 | 子 | 而 | 其 | 他 | 细 | 胞 | 的 | 突 | 变 | 则 | 会 | 导 | 致 | 细 | 胞 | 死 | 亡 | 或 | 癌 | 症 |',
  'num_samples': 192960,
  'gender': 'MALE'},
 {'id': 1757,
  'file_name': '4041092252337108851.wav',
  'raw_transcription': '只有生殖细胞的突变才会遗传给孩子,而其他细胞的突变则会导致细胞死亡或癌症。',
  'transcription': '只 有 生 殖 细 胞 的 突 变 才 会 遗 传 给 孩 子 而 其 他 细 胞 的 突 变 则 会 导 致 细 胞 死 亡 或 癌 症',
  '_': '只 | 有 | 生 | 殖 | 细 | 胞 | 的 | 突 | 变 | 才 | 会 | 遗 | 传 | 给 | 孩 | 子 | 而 | 其 | 他 | 细 | 胞 | 的 | 突 | 变 | 则 | 会 | 导 | 致 | 细 | 胞 | 死 | 亡 | 或 | 癌 | 症 |',
  'num_samples': 154560,
  'gender': 'MALE'},
 {'id': 1757,
  'file_name': '15690736386189159399.wav',
  'raw_transcription': '只有生殖细胞的突变才会遗传给孩子,而其他细胞的突变则会导致细胞死亡或癌症。',
  'transcription': '只 有 生 殖 细 胞 的 突 变 才 会 遗 传 给 孩 子 而 其 他 细 胞 的 突 变 则 会 导 致 细 胞 死 亡 或 癌 症',
  '_': '只 | 有 | 生 | 殖 | 细 | 胞 | 的 | 突 | 变 | 才 | 会 | 遗 | 传 | 给 | 孩 | 子 | 而 | 其 | 他 | 细 | 胞 | 的 | 突 | 变 | 则 | 会 | 导 | 致 | 细 | 胞 | 死 | 亡 | 或 | 癌 | 症 |',
  'num_samples': 210880,
  'gender': 'MALE'},
 {'id': 1936,
  'file_name': '14619049882476241833.wav',
  'raw_transcription': '佩里表示,他会“返回得克萨斯,评估今晚党团会议的结果,明确自己在这次较量中是否有胜算的余地”。但后来他又表示会继续参加竞选,并参加于 1 月 21 日在南卡罗莱纳州举行的初选。',
  'transcription': '佩 里 表 示 他 会 返 回 得 克 萨 斯 评 估 今 晚 党 团 会 议 的 结 果 明 确 自 己 在 这 次 较 量 中 是 否 有 胜 算 的 余 地 但 后 来 他 又 表 示 会 继 续 参 加 竞 选 并 参 加 于 1 月 21 日 在 南 卡 罗 莱 纳 州 举 行 的 初 选',
  '_': '佩 | 里 | 表 | 示 | 他 | 会 | 返 | 回 | 得 | 克 | 萨 | 斯 | 评 | 估 | 今 | 晚 | 党 | 团 | 会 | 议 | 的 | 结 | 果 | 明 | 确 | 自 | 己 | 在 | 这 | 次 | 较 | 量 | 中 | 是 | 否 | 有 | 胜 | 算 | 的 | 余 | 地 | 但 | 后 | 来 | 他 | 又 | 表 | 示 | 会 | 继 | 续 | 参 | 加 | 竞 | 选 | 并 | 参 | 加 | 于 | 1 | 月 | 2 1 | 日 | 在 | 南 | 卡 | 罗 | 莱 | 纳 | 州 | 举 | 行 | 的 | 初 | 选 |',
  'num_samples': 338880,
  'gender': 'MALE'},
 {'id': 1936,
  'file_name': '6379777091826266823.wav',
  'raw_transcription': '佩里表示,他会“返回得克萨斯,评估今晚党团会议的结果,明确自己在这次较量中是否有胜算的余地”。但后来他又表示会继续参加竞选,并参加于 1 月 21 日在南卡罗莱纳州举行的初选。',
  'transcription': '佩 里 表 示 他 会 返 回 得 克 萨 斯 评 估 今 晚 党 团 会 议 的 结 果 明 确 自 己 在 这 次 较 量 中 是 否 有 胜 算 的 余 地 但 后 来 他 又 表 示 会 继 续 参 加 竞 选 并 参 加 于 1 月 21 日 在 南 卡 罗 莱 纳 州 举 行 的 初 选',
  '_': '佩 | 里 | 表 | 示 | 他 | 会 | 返 | 回 | 得 | 克 | 萨 | 斯 | 评 | 估 | 今 | 晚 | 党 | 团 | 会 | 议 | 的 | 结 | 果 | 明 | 确 | 自 | 己 | 在 | 这 | 次 | 较 | 量 | 中 | 是 | 否 | 有 | 胜 | 算 | 的 | 余 | 地 | 但 | 后 | 来 | 他 | 又 | 表 | 示 | 会 | 继 | 续 | 参 | 加 | 竞 | 选 | 并 | 参 | 加 | 于 | 1 | 月 | 2 1 | 日 | 在 | 南 | 卡 | 罗 | 莱 | 纳 | 州 | 举 | 行 | 的 | 初 | 选 |',
  'num_samples': 360000,
  'gender': 'MALE'},
 {'id': 1936,
  'file_name': '17802342630468379709.wav',
  'raw_transcription': '佩里表示,他会“返回得克萨斯,评估今晚党团会议的结果,明确自己在这次较量中是否有胜算的余地”。但后来他又表示会继续参加竞选,并参加于 1 月 21 日在南卡罗莱纳州举行的初选。',
  'transcription': '佩 里 表 示 他 会 返 回 得 克 萨 斯 评 估 今 晚 党 团 会 议 的 结 果 明 确 自 己 在 这 次 较 量 中 是 否 有 胜 算 的 余 地 但 后 来 他 又 表 示 会 继 续 参 加 竞 选 并 参 加 于 1 月 21 日 在 南 卡 罗 莱 纳 州 举 行 的 初 选',
  '_': '佩 | 里 | 表 | 示 | 他 | 会 | 返 | 回 | 得 | 克 | 萨 | 斯 | 评 | 估 | 今 | 晚 | 党 | 团 | 会 | 议 | 的 | 结 | 果 | 明 | 确 | 自 | 己 | 在 | 这 | 次 | 较 | 量 | 中 | 是 | 否 | 有 | 胜 | 算 | 的 | 余 | 地 | 但 | 后 | 来 | 他 | 又 | 表 | 示 | 会 | 继 | 续 | 参 | 加 | 竞 | 选 | 并 | 参 | 加 | 于 | 1 | 月 | 2 1 | 日 | 在 | 南 | 卡 | 罗 | 莱 | 纳 | 州 | 举 | 行 | 的 | 初 | 选 |',
  'num_samples': 380480,
  'gender': 'MALE'},
 {'id': 1760,
  'file_name': '10797488489095533876.wav',
  'raw_transcription': '沧龙是那个时代的顶级掠食者,除了同类它什么都不怕。',
  'transcription': '沧 龙 是 那 个 时 代 的 顶 级 掠 食 者 除 了 同 类 它 什 么 都 不 怕',
  '_': '沧 | 龙 | 是 | 那 | 个 | 时 | 代 | 的 | 顶 | 级 | 掠 | 食 | 者 | 除 | 了 | 同 | 类 | 它 | 什 | 么 | 都 | 不 | 怕 |',
  'num_samples': 89280,
  'gender': 'FEMALE'},
 {'id': 1760,
  'file_name': '16448462145685838486.wav',
  'raw_transcription': '沧龙是那个时代的顶级掠食者,除了同类它什么都不怕。',
  'transcription': '沧 龙 是 那 个 时 代 的 顶 级 掠 食 者 除 了 同 类 它 什 么 都 不 怕',
  '_': '沧 | 龙 | 是 | 那 | 个 | 时 | 代 | 的 | 顶 | 级 | 掠 | 食 | 者 | 除 | 了 | 同 | 类 | 它 | 什 | 么 | 都 | 不 | 怕 |',
  'num_samples': 94080,
  'gender': 'FEMALE'},
 {'id': 1760,
  'file_name': '1967296384022534103.wav',
  'raw_transcription': '沧龙是那个时代的顶级掠食者,除了同类它什么都不怕。',
  'transcription': '沧 龙 是 那 个 时 代 的 顶 级 掠 食 者 除 了 同 类 它 什 么 都 不 怕',
  '_': '沧 | 龙 | 是 | 那 | 个 | 时 | 代 | 的 | 顶 | 级 | 掠 | 食 | 者 | 除 | 了 | 同 | 类 | 它 | 什 | 么 | 都 | 不 | 怕 |',
  'num_samples': 90240,
  'gender': 'FEMALE'},
 {'id': 1707,
  'file_name': '6407377632218991618.wav',
  'raw_transcription': '它是南非的主要景点之一,被认为是南非国家公园体系 (SANParks) 的主打景点。',
  'transcription': '它 是 南 非 的 主 要 景 点 之 一 被 认 为 是 南 非 国 家 公 园 体 系 sanparks 的 主 打 景 点',
  '_': '它 | 是 | 南 | 非 | 的 | 主 | 要 | 景 | 点 | 之 | 一 | 被 | 认 | 为 | 是 | 南 | 非 | 国 | 家 | 公 | 园 | 体 | 系 | s a n p a r k s | 的 | 主 | 打 | 景 | 点 |',
  'num_samples': 221120,
  'gender': 'MALE'},
 {'id': 1707,
  'file_name': '2382187463198843534.wav',
  'raw_transcription': '它是南非的主要景点之一,被认为是南非国家公园体系 (SANParks) 的主打景点。',
  'transcription': '它 是 南 非 的 主 要 景 点 之 一 被 认 为 是 南 非 国 家 公 园 体 系 sanparks 的 主 打 景 点',
  '_': '它 | 是 | 南 | 非 | 的 | 主 | 要 | 景 | 点 | 之 | 一 | 被 | 认 | 为 | 是 | 南 | 非 | 国 | 家 | 公 | 园 | 体 | 系 | s a n p a r k s | 的 | 主 | 打 | 景 | 点 |',
  'num_samples': 103680,
  'gender': 'FEMALE'},
 {'id': 1707,
  'file_name': '2578802827824598981.wav',
  'raw_transcription': '它是南非的主要景点之一,被认为是南非国家公园体系 (SANParks) 的主打景点。',
  'transcription': '它 是 南 非 的 主 要 景 点 之 一 被 认 为 是 南 非 国 家 公 园 体 系 sanparks 的 主 打 景 点',
  '_': '它 | 是 | 南 | 非 | 的 | 主 | 要 | 景 | 点 | 之 | 一 | 被 | 认 | 为 | 是 | 南 | 非 | 国 | 家 | 公 | 园 | 体 | 系 | s a n p a r k s | 的 | 主 | 打 | 景 | 点 |',
  'num_samples': 116160,
  'gender': 'FEMALE'},
 {'id': 1970,
  'file_name': '7157779345373697984.wav',
  'raw_transcription': '它的舌头有可能是分叉的,对此我们尚不确定。它的食物包括海龟、大型鱼类、其他沧龙,甚至会吃人。',
  'transcription': '它 的 舌 头 有 可 能 是 分 叉 的 对 此 我 们 尚 不 确 定 它 的 食 物 包 括 海 龟 大 型 鱼 类 其 他 沧 龙 甚 至 会 吃 人',
  '_': '它 | 的 | 舌 | 头 | 有 | 可 | 能 | 是 | 分 | 叉 | 的 | 对 | 此 | 我 | 们 | 尚 | 不 | 确 | 定 | 它 | 的 | 食 | 物 | 包 | 括 | 海 | 龟 | 大 | 型 | 鱼 | 类 | 其 | 他 | 沧 | 龙 | 甚 | 至 | 会 | 吃 | 人 |',
  'num_samples': 182400,
  'gender': 'FEMALE'},
 {'id': 1970,
  'file_name': '13652991672889747015.wav',
  'raw_transcription': '它的舌头有可能是分叉的,对此我们尚不确定。它的食物包括海龟、大型鱼类、其他沧龙,甚至会吃人。',
  'transcription': '它 的 舌 头 有 可 能 是 分 叉 的 对 此 我 们 尚 不 确 定 它 的 食 物 包 括 海 龟 大 型 鱼 类 其 他 沧 龙 甚 至 会 吃 人',
  '_': '它 | 的 | 舌 | 头 | 有 | 可 | 能 | 是 | 分 | 叉 | 的 | 对 | 此 | 我 | 们 | 尚 | 不 | 确 | 定 | 它 | 的 | 食 | 物 | 包 | 括 | 海 | 龟 | 大 | 型 | 鱼 | 类 | 其 | 他 | 沧 | 龙 | 甚 | 至 | 会 | 吃 | 人 |',
  'num_samples': 234240,
  'gender': 'MALE'},
 {'id': 1970,
  'file_name': '13113379443988764216.wav',
  'raw_transcription': '它的舌头有可能是分叉的,对此我们尚不确定。它的食物包括海龟、大型鱼类、其他沧龙,甚至会吃人。',
  'transcription': '它 的 舌 头 有 可 能 是 分 叉 的 对 此 我 们 尚 不 确 定 它 的 食 物 包 括 海 龟 大 型 鱼 类 其 他 沧 龙 甚 至 会 吃 人',
  '_': '它 | 的 | 舌 | 头 | 有 | 可 | 能 | 是 | 分 | 叉 | 的 | 对 | 此 | 我 | 们 | 尚 | 不 | 确 | 定 | 它 | 的 | 食 | 物 | 包 | 括 | 海 | 龟 | 大 | 型 | 鱼 | 类 | 其 | 他 | 沧 | 龙 | 甚 | 至 | 会 | 吃 | 人 |',
  'num_samples': 149760,
  'gender': 'FEMALE'},
 {'id': 1662,
  'file_name': '15556592618355765026.wav',
  'raw_transcription': '合金基本上由两种或以上金属混合而成。不要忘记一点,元素周期表上有很多元素。',
  'transcription': '合 金 基 本 上 由 两 种 或 以 上 金 属 混 合 而 成 不 要 忘 记 一 点 元 素 周 期 表 上 有 很 多 元 素',
  '_': '合 | 金 | 基 | 本 | 上 | 由 | 两 | 种 | 或 | 以 | 上 | 金 | 属 | 混 | 合 | 而 | 成 | 不 | 要 | 忘 | 记 | 一 | 点 | 元 | 素 | 周 | 期 | 表 | 上 | 有 | 很 | 多 | 元 | 素 |',
  'num_samples': 158400,
  'gender': 'MALE'},
 {'id': 1662,
  'file_name': '2806736376206509940.wav',
  'raw_transcription': '合金基本上由两种或以上金属混合而成。不要忘记一点,元素周期表上有很多元素。',
  'transcription': '合 金 基 本 上 由 两 种 或 以 上 金 属 混 合 而 成 不 要 忘 记 一 点 元 素 周 期 表 上 有 很 多 元 素',
  '_': '合 | 金 | 基 | 本 | 上 | 由 | 两 | 种 | 或 | 以 | 上 | 金 | 属 | 混 | 合 | 而 | 成 | 不 | 要 | 忘 | 记 | 一 | 点 | 元 | 素 | 周 | 期 | 表 | 上 | 有 | 很 | 多 | 元 | 素 |',
  'num_samples': 240320,
  'gender': 'MALE'},
 {'id': 1662,
  'file_name': '13372204995113843403.wav',
  'raw_transcription': '合金基本上由两种或以上金属混合而成。不要忘记一点,元素周期表上有很多元素。',
  'transcription': '合 金 基 本 上 由 两 种 或 以 上 金 属 混 合 而 成 不 要 忘 记 一 点 元 素 周 期 表 上 有 很 多 元 素',
  '_': '合 | 金 | 基 | 本 | 上 | 由 | 两 | 种 | 或 | 以 | 上 | 金 | 属 | 混 | 合 | 而 | 成 | 不 | 要 | 忘 | 记 | 一 | 点 | 元 | 素 | 周 | 期 | 表 | 上 | 有 | 很 | 多 | 元 | 素 |',
  'num_samples': 120000,
  'gender': 'FEMALE'},
 {'id': 1660,
  'file_name': '7976743456431177516.wav',
  'raw_transcription': '浪漫主义具有很强的文化决定论色彩。这源于歌德、费希特和施莱格尔等作家。',
  'transcription': '浪 漫 主 义 具 有 很 强 的 文 化 决 定 论 色 彩 这 源 于 歌 德 费 希 特 和 施 莱 格 尔 等 作 家',
  '_': '浪 | 漫 | 主 | 义 | 具 | 有 | 很 | 强 | 的 | 文 | 化 | 决 | 定 | 论 | 色 | 彩 | 这 | 源 | 于 | 歌 | 德 | 费 | 希 | 特 | 和 | 施 | 莱 | 格 | 尔 | 等 | 作 | 家 |',
  'num_samples': 182400,
  'gender': 'MALE'},
 {'id': 1660,
  'file_name': '14745184445569516164.wav',
  'raw_transcription': '浪漫主义具有很强的文化决定论色彩。这源于歌德、费希特和施莱格尔等作家。',
  'transcription': '浪 漫 主 义 具 有 很 强 的 文 化 决 定 论 色 彩 这 源 于 歌 德 费 希 特 和 施 莱 格 尔 等 作 家',
  '_': '浪 | 漫 | 主 | 义 | 具 | 有 | 很 | 强 | 的 | 文 | 化 | 决 | 定 | 论 | 色 | 彩 | 这 | 源 | 于 | 歌 | 德 | 费 | 希 | 特 | 和 | 施 | 莱 | 格 | 尔 | 等 | 作 | 家 |',
  'num_samples': 277760,
  'gender': 'MALE'},
 {'id': 1660,
  'file_name': '14273482665670127172.wav',
  'raw_transcription': '浪漫主义具有很强的文化决定论色彩。这源于歌德、费希特和施莱格尔等作家。',
  'transcription': '浪 漫 主 义 具 有 很 强 的 文 化 决 定 论 色 彩 这 源 于 歌 德 费 希 特 和 施 莱 格 尔 等 作 家',
  '_': '浪 | 漫 | 主 | 义 | 具 | 有 | 很 | 强 | 的 | 文 | 化 | 决 | 定 | 论 | 色 | 彩 | 这 | 源 | 于 | 歌 | 德 | 费 | 希 | 特 | 和 | 施 | 莱 | 格 | 尔 | 等 | 作 | 家 |',
  'num_samples': 153600,
  'gender': 'MALE'},
 {'id': 1769,
  'file_name': '710895149610681971.wav',
  'raw_transcription': '大金字塔是埃及人在公元前三世纪的杰作,它是众多向已故法老表示敬意的大型金字塔的其中之一。',
  'transcription': '大 金 字 塔 是 埃 及 人 在 公 元 前 三 世 纪 的 杰 作 它 是 众 多 向 已 故 法 老 表 示 敬 意 的 大 型 金 字 塔 的 其 中 之 一',
  '_': '大 | 金 | 字 | 塔 | 是 | 埃 | 及 | 人 | 在 | 公 | 元 | 前 | 三 | 世 | 纪 | 的 | 杰 | 作 | 它 | 是 | 众 | 多 | 向 | 已 | 故 | 法 | 老 | 表 | 示 | 敬 | 意 | 的 | 大 | 型 | 金 | 字 | 塔 | 的 | 其 | 中 | 之 | 一 |',
  'num_samples': 201600,
  'gender': 'MALE'},
 {'id': 1769,
  'file_name': '9317303892015789189.wav',
  'raw_transcription': '大金字塔是埃及人在公元前三世纪的杰作,它是众多向已故法老表示敬意的大型金字塔的其中之一。',
  'transcription': '大 金 字 塔 是 埃 及 人 在 公 元 前 三 世 纪 的 杰 作 它 是 众 多 向 已 故 法 老 表 示 敬 意 的 大 型 金 字 塔 的 其 中 之 一',
  '_': '大 | 金 | 字 | 塔 | 是 | 埃 | 及 | 人 | 在 | 公 | 元 | 前 | 三 | 世 | 纪 | 的 | 杰 | 作 | 它 | 是 | 众 | 多 | 向 | 已 | 故 | 法 | 老 | 表 | 示 | 敬 | 意 | 的 | 大 | 型 | 金 | 字 | 塔 | 的 | 其 | 中 | 之 | 一 |',
  'num_samples': 132480,
  'gender': 'FEMALE'},
 {'id': 1769,
  'file_name': '1647373097021300770.wav',
  'raw_transcription': '大金字塔是埃及人在公元前三世纪的杰作,它是众多向已故法老表示敬意的大型金字塔的其中之一。',
  'transcription': '大 金 字 塔 是 埃 及 人 在 公 元 前 三 世 纪 的 杰 作 它 是 众 多 向 已 故 法 老 表 示 敬 意 的 大 型 金 字 塔 的 其 中 之 一',
  '_': '大 | 金 | 字 | 塔 | 是 | 埃 | 及 | 人 | 在 | 公 | 元 | 前 | 三 | 世 | 纪 | 的 | 杰 | 作 | 它 | 是 | 众 | 多 | 向 | 已 | 故 | 法 | 老 | 表 | 示 | 敬 | 意 | 的 | 大 | 型 | 金 | 字 | 塔 | 的 | 其 | 中 | 之 | 一 |',
  'num_samples': 171840,
  'gender': 'MALE'},
 {'id': 1826,
  'file_name': '5394813682536993655.wav',
  'raw_transcription': '事故发生后,吉布森被送往医院,但很快就一命呜呼。',
  'transcription': '事 故 发 生 后 吉 布 森 被 送 往 医 院 但 很 快 就 一 命 呜 呼',
  '_': '事 | 故 | 发 | 生 | 后 | 吉 | 布 | 森 | 被 | 送 | 往 | 医 | 院 | 但 | 很 | 快 | 就 | 一 | 命 | 呜 | 呼 |',
  'num_samples': 177920,
  'gender': 'MALE'},
 {'id': 1826,
  'file_name': '1217058574298081955.wav',
  'raw_transcription': '事故发生后,吉布森被送往医院,但很快就一命呜呼。',
  'transcription': '事 故 发 生 后 吉 布 森 被 送 往 医 院 但 很 快 就 一 命 呜 呼',
  '_': '事 | 故 | 发 | 生 | 后 | 吉 | 布 | 森 | 被 | 送 | 往 | 医 | 院 | 但 | 很 | 快 | 就 | 一 | 命 | 呜 | 呼 |',
  'num_samples': 120000,
  'gender': 'MALE'},
 {'id': 1826,
  'file_name': '4515552419232880725.wav',
  'raw_transcription': '事故发生后,吉布森被送往医院,但很快就一命呜呼。',
  'transcription': '事 故 发 生 后 吉 布 森 被 送 往 医 院 但 很 快 就 一 命 呜 呼',
  '_': '事 | 故 | 发 | 生 | 后 | 吉 | 布 | 森 | 被 | 送 | 往 | 医 | 院 | 但 | 很 | 快 | 就 | 一 | 命 | 呜 | 呼 |',
  'num_samples': 126720,
  'gender': 'MALE'},
 {'id': 1904,
  'file_name': '17212379381071513320.wav',
  'raw_transcription': '然而,由于文化交流迟缓,西方的时尚可能落后 25 到 30 年。',
  'transcription': '然 而 由 于 文 化 交 流 迟 缓 西 方 的 时 尚 可 能 落 后 25 到 30 年',
  '_': '然 | 而 | 由 | 于 | 文 | 化 | 交 | 流 | 迟 | 缓 | 西 | 方 | 的 | 时 | 尚 | 可 | 能 | 落 | 后 | 2 5 | 到 | 3 0 | 年 |',
  'num_samples': 142080,
  'gender': 'MALE'},
 {'id': 1904,
  'file_name': '6215757251639853260.wav',
  'raw_transcription': '然而,由于文化交流迟缓,西方的时尚可能落后 25 到 30 年。',
  'transcription': '然 而 由 于 文 化 交 流 迟 缓 西 方 的 时 尚 可 能 落 后 25 到 30 年',
  '_': '然 | 而 | 由 | 于 | 文 | 化 | 交 | 流 | 迟 | 缓 | 西 | 方 | 的 | 时 | 尚 | 可 | 能 | 落 | 后 | 2 5 | 到 | 3 0 | 年 |',
  'num_samples': 246400,
  'gender': 'MALE'},
 {'id': 1904,
  'file_name': '15647719969739775381.wav',
  'raw_transcription': '然而,由于文化交流迟缓,西方的时尚可能落后 25 到 30 年。',
  'transcription': '然 而 由 于 文 化 交 流 迟 缓 西 方 的 时 尚 可 能 落 后 25 到 30 年',
  '_': '然 | 而 | 由 | 于 | 文 | 化 | 交 | 流 | 迟 | 缓 | 西 | 方 | 的 | 时 | 尚 | 可 | 能 | 落 | 后 | 2 5 | 到 | 3 0 | 年 |',
  'num_samples': 130560,
  'gender': 'MALE'},
 {'id': 1892,
  'file_name': '3288048762463692678.wav',
  'raw_transcription': '这里是英国殖民者占领的地方,所以如果你想寻找这片领土殖民历史的证据,这里是一个很好的起点。',
  'transcription': '这 里 是 英 国 殖 民 者 占 领 的 地 方 所 以 如 果 你 想 寻 找 这 片 领 土 殖 民 历 史 的 证 据 这 里 是 一 个 很 好 的 起 点',
  '_': '这 | 里 | 是 | 英 | 国 | 殖 | 民 | 者 | 占 | 领 | 的 | 地 | 方 | 所 | 以 | 如 | 果 | 你 | 想 | 寻 | 找 | 这 | 片 | 领 | 土 | 殖 | 民 | 历 | 史 | 的 | 证 | 据 | 这 | 里 | 是 | 一 | 个 | 很 | 好 | 的 | 起 | 点 |',
  'num_samples': 268800,
  'gender': 'MALE'},
 {'id': 1892,
  'file_name': '7770717307944905290.wav',
  'raw_transcription': '这里是英国殖民者占领的地方,所以如果你想寻找这片领土殖民历史的证据,这里是一个很好的起点。',
  'transcription': '这 里 是 英 国 殖 民 者 占 领 的 地 方 所 以 如 果 你 想 寻 找 这 片 领 土 殖 民 历 史 的 证 据 这 里 是 一 个 很 好 的 起 点',
  '_': '这 | 里 | 是 | 英 | 国 | 殖 | 民 | 者 | 占 | 领 | 的 | 地 | 方 | 所 | 以 | 如 | 果 | 你 | 想 | 寻 | 找 | 这 | 片 | 领 | 土 | 殖 | 民 | 历 | 史 | 的 | 证 | 据 | 这 | 里 | 是 | 一 | 个 | 很 | 好 | 的 | 起 | 点 |',
  'num_samples': 250240,
  'gender': 'MALE'},
 {'id': 1892,
  'file_name': '775506143805267767.wav',
  'raw_transcription': '这里是英国殖民者占领的地方,所以如果你想寻找这片领土殖民历史的证据,这里是一个很好的起点。',
  'transcription': '这 里 是 英 国 殖 民 者 占 领 的 地 方 所 以 如 果 你 想 寻 找 这 片 领 土 殖 民 历 史 的 证 据 这 里 是 一 个 很 好 的 起 点',
  '_': '这 | 里 | 是 | 英 | 国 | 殖 | 民 | 者 | 占 | 领 | 的 | 地 | 方 | 所 | 以 | 如 | 果 | 你 | 想 | 寻 | 找 | 这 | 片 | 领 | 土 | 殖 | 民 | 历 | 史 | 的 | 证 | 据 | 这 | 里 | 是 | 一 | 个 | 很 | 好 | 的 | 起 | 点 |',
  'num_samples': 172800,
  'gender': 'MALE'},
 {'id': 1744,
  'file_name': '17583737491396833597.wav',
  'raw_transcription': '罗斯贝数越小,恒星在磁场倒转方面就越不活跃。',
  'transcription': '罗 斯 贝 数 越 小 恒 星 在 磁 场 倒 转 方 面 就 越 不 活 跃',
  '_': '罗 | 斯 | 贝 | 数 | 越 | 小 | 恒 | 星 | 在 | 磁 | 场 | 倒 | 转 | 方 | 面 | 就 | 越 | 不 | 活 | 跃 |',
  'num_samples': 99840,
  'gender': 'FEMALE'},
 {'id': 1744,
  'file_name': '16549419822262830660.wav',
  'raw_transcription': '罗斯贝数越小,恒星在磁场倒转方面就越不活跃。',
  'transcription': '罗 斯 贝 数 越 小 恒 星 在 磁 场 倒 转 方 面 就 越 不 活 跃',
  '_': '罗 | 斯 | 贝 | 数 | 越 | 小 | 恒 | 星 | 在 | 磁 | 场 | 倒 | 转 | 方 | 面 | 就 | 越 | 不 | 活 | 跃 |',
  'num_samples': 77760,
  'gender': 'FEMALE'},
 {'id': 1744,
  'file_name': '16608907880210830910.wav',
  'raw_transcription': '罗斯贝数越小,恒星在磁场倒转方面就越不活跃。',
  'transcription': '罗 斯 贝 数 越 小 恒 星 在 磁 场 倒 转 方 面 就 越 不 活 跃',
  '_': '罗 | 斯 | 贝 | 数 | 越 | 小 | 恒 | 星 | 在 | 磁 | 场 | 倒 | 转 | 方 | 面 | 就 | 越 | 不 | 活 | 跃 |',
  'num_samples': 130560,
  'gender': 'MALE'},
 {'id': 1991,
  'file_name': '14288669610334440124.wav',
  'raw_transcription': '在欧洲历史上的这段时期,已然富有而强大起来的天主教会受到了密切监督。',
  'transcription': '在 欧 洲 历 史 上 的 这 段 时 期 已 然 富 有 而 强 大 起 来 的 天 主 教 会 受 到 了 密 切 监 督',
  '_': '在 | 欧 | 洲 | 历 | 史 | 上 | 的 | 这 | 段 | 时 | 期 | 已 | 然 | 富 | 有 | 而 | 强 | 大 | 起 | 来 | 的 | 天 | 主 | 教 | 会 | 受 | 到 | 了 | 密 | 切 | 监 | 督 |',
  'num_samples': 126720,
  'gender': 'FEMALE'},
 {'id': 1991,
  'file_name': '2910705462929474039.wav',
  'raw_transcription': '在欧洲历史上的这段时期,已然富有而强大起来的天主教会受到了密切监督。',
  'transcription': '在 欧 洲 历 史 上 的 这 段 时 期 已 然 富 有 而 强 大 起 来 的 天 主 教 会 受 到 了 密 切 监 督',
  '_': '在 | 欧 | 洲 | 历 | 史 | 上 | 的 | 这 | 段 | 时 | 期 | 已 | 然 | 富 | 有 | 而 | 强 | 大 | 起 | 来 | 的 | 天 | 主 | 教 | 会 | 受 | 到 | 了 | 密 | 切 | 监 | 督 |',
  'num_samples': 217920,
  'gender': 'MALE'},
 {'id': 1991,
  'file_name': '5743230626485424345.wav',
  'raw_transcription': '在欧洲历史上的这段时期,已然富有而强大起来的天主教会受到了密切监督。',
  'transcription': '在 欧 洲 历 史 上 的 这 段 时 期 已 然 富 有 而 强 大 起 来 的 天 主 教 会 受 到 了 密 切 监 督',
  '_': '在 | 欧 | 洲 | 历 | 史 | 上 | 的 | 这 | 段 | 时 | 期 | 已 | 然 | 富 | 有 | 而 | 强 | 大 | 起 | 来 | 的 | 天 | 主 | 教 | 会 | 受 | 到 | 了 | 密 | 切 | 监 | 督 |',
  'num_samples': 119040,
  'gender': 'FEMALE'},
 {'id': 1920,
  'file_name': '6199631344223625246.wav',
  'raw_transcription': '他们通常会提供特别的食品、饮料和娱乐活动,让客人保持愉悦,留在赌场。',
  'transcription': '他 们 通 常 会 提 供 特 别 的 食 品 饮 料 和 娱 乐 活 动 让 客 人 保 持 愉 悦 留 在 赌 场',
  '_': '他 | 们 | 通 | 常 | 会 | 提 | 供 | 特 | 别 | 的 | 食 | 品 | 饮 | 料 | 和 | 娱 | 乐 | 活 | 动 | 让 | 客 | 人 | 保 | 持 | 愉 | 悦 | 留 | 在 | 赌 | 场 |',
  'num_samples': 149760,
  'gender': 'MALE'},
 {'id': 1920,
  'file_name': '18446072025695442116.wav',
  'raw_transcription': '他们通常会提供特别的食品、饮料和娱乐活动,让客人保持愉悦,留在赌场。',
  'transcription': '他 们 通 常 会 提 供 特 别 的 食 品 饮 料 和 娱 乐 活 动 让 客 人 保 持 愉 悦 留 在 赌 场',
  '_': '他 | 们 | 通 | 常 | 会 | 提 | 供 | 特 | 别 | 的 | 食 | 品 | 饮 | 料 | 和 | 娱 | 乐 | 活 | 动 | 让 | 客 | 人 | 保 | 持 | 愉 | 悦 | 留 | 在 | 赌 | 场 |',
  'num_samples': 135360,
  'gender': 'MALE'},
 {'id': 1920,
  'file_name': '18225195044835443946.wav',
  'raw_transcription': '他们通常会提供特别的食品、饮料和娱乐活动,让客人保持愉悦,留在赌场。',
  'transcription': '他 们 通 常 会 提 供 特 别 的 食 品 饮 料 和 娱 乐 活 动 让 客 人 保 持 愉 悦 留 在 赌 场',
  '_': '他 | 们 | 通 | 常 | 会 | 提 | 供 | 特 | 别 | 的 | 食 | 品 | 饮 | 料 | 和 | 娱 | 乐 | 活 | 动 | 让 | 客 | 人 | 保 | 持 | 愉 | 悦 | 留 | 在 | 赌 | 场 |',
  'num_samples': 119040,
  'gender': 'FEMALE'},
 {'id': 2002,
  'file_name': '15164145102076074278.wav',
  'raw_transcription': '它让玩家可以通过在空中移动设备来控制电子游戏中的运动和操作。',
  'transcription': '它 让 玩 家 可 以 通 过 在 空 中 移 动 设 备 来 控 制 电 子 游 戏 中 的 运 动 和 操 作',
  '_': '它 | 让 | 玩 | 家 | 可 | 以 | 通 | 过 | 在 | 空 | 中 | 移 | 动 | 设 | 备 | 来 | 控 | 制 | 电 | 子 | 游 | 戏 | 中 | 的 | 运 | 动 | 和 | 操 | 作 |',
  'num_samples': 127680,
  'gender': 'MALE'},
 {'id': 2002,
  'file_name': '5263419464881767602.wav',
  'raw_transcription': '它让玩家可以通过在空中移动设备来控制电子游戏中的运动和操作。',
  'transcription': '它 让 玩 家 可 以 通 过 在 空 中 移 动 设 备 来 控 制 电 子 游 戏 中 的 运 动 和 操 作',
  '_': '它 | 让 | 玩 | 家 | 可 | 以 | 通 | 过 | 在 | 空 | 中 | 移 | 动 | 设 | 备 | 来 | 控 | 制 | 电 | 子 | 游 | 戏 | 中 | 的 | 运 | 动 | 和 | 操 | 作 |',
  'num_samples': 226240,
  'gender': 'MALE'},
 {'id': 2002,
  'file_name': '10571681330551714048.wav',
  'raw_transcription': '它让玩家可以通过在空中移动设备来控制电子游戏中的运动和操作。',
  'transcription': '它 让 玩 家 可 以 通 过 在 空 中 移 动 设 备 来 控 制 电 子 游 戏 中 的 运 动 和 操 作',
  '_': '它 | 让 | 玩 | 家 | 可 | 以 | 通 | 过 | 在 | 空 | 中 | 移 | 动 | 设 | 备 | 来 | 控 | 制 | 电 | 子 | 游 | 戏 | 中 | 的 | 运 | 动 | 和 | 操 | 作 |',
  'num_samples': 108480,
  'gender': 'FEMALE'},
 {'id': 1938,
  'file_name': '6572648557870272202.wav',
  'raw_transcription': '医院遵循了感染控制规定,包括把患者与他人隔离,以防感染到其他人。',
  'transcription': '医 院 遵 循 了 感 染 控 制 规 定 包 括 把 患 者 与 他 人 隔 离 以 防 感 染 到 其 他 人',
  '_': '医 | 院 | 遵 | 循 | 了 | 感 | 染 | 控 | 制 | 规 | 定 | 包 | 括 | 把 | 患 | 者 | 与 | 他 | 人 | 隔 | 离 | 以 | 防 | 感 | 染 | 到 | 其 | 他 | 人 |',
  'num_samples': 176640,
  'gender': 'MALE'},
 {'id': 1938,
  'file_name': '13802531128842061050.wav',
  'raw_transcription': '医院遵循了感染控制规定,包括把患者与他人隔离,以防感染到其他人。',
  'transcription': '医 院 遵 循 了 感 染 控 制 规 定 包 括 把 患 者 与 他 人 隔 离 以 防 感 染 到 其 他 人',
  '_': '医 | 院 | 遵 | 循 | 了 | 感 | 染 | 控 | 制 | 规 | 定 | 包 | 括 | 把 | 患 | 者 | 与 | 他 | 人 | 隔 | 离 | 以 | 防 | 感 | 染 | 到 | 其 | 他 | 人 |',
  'num_samples': 137280,
  'gender': 'MALE'},
 {'id': 1938,
  'file_name': '7425281262677708937.wav',
  'raw_transcription': '医院遵循了感染控制规定,包括把患者与他人隔离,以防感染到其他人。',
  'transcription': '医 院 遵 循 了 感 染 控 制 规 定 包 括 把 患 者 与 他 人 隔 离 以 防 感 染 到 其 他 人',
  '_': '医 | 院 | 遵 | 循 | 了 | 感 | 染 | 控 | 制 | 规 | 定 | 包 | 括 | 把 | 患 | 者 | 与 | 他 | 人 | 隔 | 离 | 以 | 防 | 感 | 染 | 到 | 其 | 他 | 人 |',
  'num_samples': 262720,
  'gender': 'MALE'},
 {'id': 1910,
  'file_name': '10154699825088384418.wav',
  'raw_transcription': '巴黎人是出了名的以自我中心、粗鲁和傲慢。',
  'transcription': '巴 黎 人 是 出 了 名 的 以 自 我 中 心 粗 鲁 和 傲 慢',
  '_': '巴 | 黎 | 人 | 是 | 出 | 了 | 名 | 的 | 以 | 自 | 我 | 中 | 心 | 粗 | 鲁 | 和 | 傲 | 慢 |',
  'num_samples': 81600,
  'gender': 'FEMALE'},
 {'id': 1910,
  'file_name': '7891476436795192215.wav',
  'raw_transcription': '巴黎人是出了名的以自我中心、粗鲁和傲慢。',
  'transcription': '巴 黎 人 是 出 了 名 的 以 自 我 中 心 粗 鲁 和 傲 慢',
  '_': '巴 | 黎 | 人 | 是 | 出 | 了 | 名 | 的 | 以 | 自 | 我 | 中 | 心 | 粗 | 鲁 | 和 | 傲 | 慢 |',
  'num_samples': 106560,
  'gender': 'MALE'},
 {'id': 1910,
  'file_name': '508195660983363004.wav',
  'raw_transcription': '巴黎人是出了名的以自我中心、粗鲁和傲慢。',
  'transcription': '巴 黎 人 是 出 了 名 的 以 自 我 中 心 粗 鲁 和 傲 慢',
  '_': '巴 | 黎 | 人 | 是 | 出 | 了 | 名 | 的 | 以 | 自 | 我 | 中 | 心 | 粗 | 鲁 | 和 | 傲 | 慢 |',
  'num_samples': 160320,
  'gender': 'MALE'},
 {'id': 1906,
  'file_name': '10837263830977293517.wav',
  'raw_transcription': '“这并不是告别。这是一个篇章的结束,也是新篇章的开始。”',
  'transcription': '这 并 不 是 告 别 这 是 一 个 篇 章 的 结 束 也 是 新 篇 章 的 开 始',
  '_': '这 | 并 | 不 | 是 | 告 | 别 | 这 | 是 | 一 | 个 | 篇 | 章 | 的 | 结 | 束 | 也 | 是 | 新 | 篇 | 章 | 的 | 开 | 始 |',
  'num_samples': 126720,
  'gender': 'MALE'},
 {'id': 1906,
  'file_name': '10026684690566417990.wav',
  'raw_transcription': '“这并不是告别。这是一个篇章的结束,也是新篇章的开始。”',
  'transcription': '这 并 不 是 告 别 这 是 一 个 篇 章 的 结 束 也 是 新 篇 章 的 开 始',
  '_': '这 | 并 | 不 | 是 | 告 | 别 | 这 | 是 | 一 | 个 | 篇 | 章 | 的 | 结 | 束 | 也 | 是 | 新 | 篇 | 章 | 的 | 开 | 始 |',
  'num_samples': 166080,
  'gender': 'MALE'},
 {'id': 1906,
  'file_name': '1614022704659592142.wav',
  'raw_transcription': '“这并不是告别。这是一个篇章的结束,也是新篇章的开始。”',
  'transcription': '这 并 不 是 告 别 这 是 一 个 篇 章 的 结 束 也 是 新 篇 章 的 开 始',
  '_': '这 | 并 | 不 | 是 | 告 | 别 | 这 | 是 | 一 | 个 | 篇 | 章 | 的 | 结 | 束 | 也 | 是 | 新 | 篇 | 章 | 的 | 开 | 始 |',
  'num_samples': 89280,
  'gender': 'FEMALE'},
 {'id': 1716,
  'file_name': '4543746568663720408.wav',
  'raw_transcription': '娱乐新闻网站TMZ了解到,该名摄影师在Sepulveda大道的另一侧停车,开始拍摄警察的拦截,并在横穿马路后继续拍照,促使进行交通拦截的加州公路巡警两次停下手中工作,命令他回到对面。',
  'transcription': '娱 乐 新 闻 网 站 tmz 了 解 到 该 名 摄 影 师 在 sepulveda 大 道 的 另 一 侧 停 车 开 始 拍 摄 警 察 的 拦 截 并 在 横 穿 马 路 后 继 续 拍 照 促 使 进 行 交 通 拦 截 的 加 州 公 路 巡 警 两 次 停 下 手 中 工 作 命 令 他 回 到 对 面',
  '_': '娱 | 乐 | 新 | 闻 | 网 | 站 | t m z | 了 | 解 | 到 | 该 | 名 | 摄 | 影 | 师 | 在 | s e p u l v e d a | 大 | 道 | 的 | 另 | 一 | 侧 | 停 | 车 | 开 | 始 | 拍 | 摄 | 警 | 察 | 的 | 拦 | 截 | 并 | 在 | 横 | 穿 | 马 | 路 | 后 | 继 | 续 | 拍 | 照 | 促 | 使 | 进 | 行 | 交 | 通 | 拦 | 截 | 的 | 加 | 州 | 公 | 路 | 巡 | 警 | 两 | 次 | 停 | 下 | 手 | 中 | 工 | 作 | 命 | 令 | 他 | 回 | 到 | 对 | 面 |',
  'num_samples': 351360,
  'gender': 'MALE'},
 {'id': 1716,
  'file_name': '7460817381270137833.wav',
  'raw_transcription': '娱乐新闻网站TMZ了解到,该名摄影师在Sepulveda大道的另一侧停车,开始拍摄警察的拦截,并在横穿马路后继续拍照,促使进行交通拦截的加州公路巡警两次停下手中工作,命令他回到对面。',
  'transcription': '娱 乐 新 闻 网 站 tmz 了 解 到 该 名 摄 影 师 在 sepulveda 大 道 的 另 一 侧 停 车 开 始 拍 摄 警 察 的 拦 截 并 在 横 穿 马 路 后 继 续 拍 照 促 使 进 行 交 通 拦 截 的 加 州 公 路 巡 警 两 次 停 下 手 中 工 作 命 令 他 回 到 对 面',
  '_': '娱 | 乐 | 新 | 闻 | 网 | 站 | t m z | 了 | 解 | 到 | 该 | 名 | 摄 | 影 | 师 | 在 | s e p u l v e d a | 大 | 道 | 的 | 另 | 一 | 侧 | 停 | 车 | 开 | 始 | 拍 | 摄 | 警 | 察 | 的 | 拦 | 截 | 并 | 在 | 横 | 穿 | 马 | 路 | 后 | 继 | 续 | 拍 | 照 | 促 | 使 | 进 | 行 | 交 | 通 | 拦 | 截 | 的 | 加 | 州 | 公 | 路 | 巡 | 警 | 两 | 次 | 停 | 下 | 手 | 中 | 工 | 作 | 命 | 令 | 他 | 回 | 到 | 对 | 面 |',
  'num_samples': 302400,
  'gender': 'FEMALE'},
 {'id': 1903,
  'file_name': '10142207404499844309.wav',
  'raw_transcription': '当所有可用的资源在一个组织的职能部门之间得到有效利用时,创造力和独创性就会发生。',
  'transcription': '当 所 有 可 用 的 资 源 在 一 个 组 织 的 职 能 部 门 之 间 得 到 有 效 利 用 时 创 造 力 和 独 创 性 就 会 发 生',
  '_': '当 | 所 | 有 | 可 | 用 | 的 | 资 | 源 | 在 | 一 | 个 | 组 | 织 | 的 | 职 | 能 | 部 | 门 | 之 | 间 | 得 | 到 | 有 | 效 | 利 | 用 | 时 | 创 | 造 | 力 | 和 | 独 | 创 | 性 | 就 | 会 | 发 | 生 |',
  'num_samples': 116160,
  'gender': 'FEMALE'},
 {'id': 1903,
  'file_name': '16000960916854882054.wav',
  'raw_transcription': '当所有可用的资源在一个组织的职能部门之间得到有效利用时,创造力和独创性就会发生。',
  'transcription': '当 所 有 可 用 的 资 源 在 一 个 组 织 的 职 能 部 门 之 间 得 到 有 效 利 用 时 创 造 力 和 独 创 性 就 会 发 生',
  '_': '当 | 所 | 有 | 可 | 用 | 的 | 资 | 源 | 在 | 一 | 个 | 组 | 织 | 的 | 职 | 能 | 部 | 门 | 之 | 间 | 得 | 到 | 有 | 效 | 利 | 用 | 时 | 创 | 造 | 力 | 和 | 独 | 创 | 性 | 就 | 会 | 发 | 生 |',
  'num_samples': 155520,
  'gender': 'MALE'},
 {'id': 1903,
  'file_name': '6793205409810650474.wav',
  'raw_transcription': '当所有可用的资源在一个组织的职能部门之间得到有效利用时,创造力和独创性就会发生。',
  'transcription': '当 所 有 可 用 的 资 源 在 一 个 组 织 的 职 能 部 门 之 间 得 到 有 效 利 用 时 创 造 力 和 独 创 性 就 会 发 生',
  '_': '当 | 所 | 有 | 可 | 用 | 的 | 资 | 源 | 在 | 一 | 个 | 组 | 织 | 的 | 职 | 能 | 部 | 门 | 之 | 间 | 得 | 到 | 有 | 效 | 利 | 用 | 时 | 创 | 造 | 力 | 和 | 独 | 创 | 性 | 就 | 会 | 发 | 生 |',
  'num_samples': 199680,
  'gender': 'MALE'},
 {'id': 1886,
  'file_name': '835791949408212859.wav',
  'raw_transcription': '古代文明和部落开始驯养它们,食用和使用它们的奶、肉、毛和皮。',
  'transcription': '古 代 文 明 和 部 落 开 始 驯 养 它 们 食 用 和 使 用 它 们 的 奶 肉 毛 和 皮',
  '_': '古 | 代 | 文 | 明 | 和 | 部 | 落 | 开 | 始 | 驯 | 养 | 它 | 们 | 食 | 用 | 和 | 使 | 用 | 它 | 们 | 的 | 奶 | 肉 | 毛 | 和 | 皮 |',
  'num_samples': 238400,
  'gender': 'MALE'},
 {'id': 1886,
  'file_name': '11225166879396446481.wav',
  'raw_transcription': '古代文明和部落开始驯养它们,食用和使用它们的奶、肉、毛和皮。',
  'transcription': '古 代 文 明 和 部 落 开 始 驯 养 它 们 食 用 和 使 用 它 们 的 奶 肉 毛 和 皮',
  '_': '古 | 代 | 文 | 明 | 和 | 部 | 落 | 开 | 始 | 驯 | 养 | 它 | 们 | 食 | 用 | 和 | 使 | 用 | 它 | 们 | 的 | 奶 | 肉 | 毛 | 和 | 皮 |',
  'num_samples': 163520,
  'gender': 'MALE'},
 {'id': 1886,
  'file_name': '15592850237782174447.wav',
  'raw_transcription': '古代文明和部落开始驯养它们,食用和使用它们的奶、肉、毛和皮。',
  'transcription': '古 代 文 明 和 部 落 开 始 驯 养 它 们 食 用 和 使 用 它 们 的 奶 肉 毛 和 皮',
  '_': '古 | 代 | 文 | 明 | 和 | 部 | 落 | 开 | 始 | 驯 | 养 | 它 | 们 | 食 | 用 | 和 | 使 | 用 | 它 | 们 | 的 | 奶 | 肉 | 毛 | 和 | 皮 |',
  'num_samples': 227840,
  'gender': 'MALE'},
 {'id': 1950,
  'file_name': '3997737225487941683.wav',
  'raw_transcription': '向北可轻松抵达浪漫迷人的辛特拉镇;它是拜伦勋爵笔下为人称道的乐土,并因此为外国人所熟知。',
  'transcription': '向 北 可 轻 松 抵 达 浪 漫 迷 人 的 辛 特 拉 镇 它 是 拜 伦 勋 爵 笔 下 为 人 称 道 的 乐 土 并 因 此 为 外 国 人 所 熟 知',
  '_': '向 | 北 | 可 | 轻 | 松 | 抵 | 达 | 浪 | 漫 | 迷 | 人 | 的 | 辛 | 特 | 拉 | 镇 | 它 | 是 | 拜 | 伦 | 勋 | 爵 | 笔 | 下 | 为 | 人 | 称 | 道 | 的 | 乐 | 土 | 并 | 因 | 此 | 为 | 外 | 国 | 人 | 所 | 熟 | 知 |',
  'num_samples': 152640,
  'gender': 'FEMALE'},
 {'id': 1950,
  'file_name': '2113862371561058434.wav',
  'raw_transcription': '向北可轻松抵达浪漫迷人的辛特拉镇;它是拜伦勋爵笔下为人称道的乐土,并因此为外国人所熟知。',
  'transcription': '向 北 可 轻 松 抵 达 浪 漫 迷 人 的 辛 特 拉 镇 它 是 拜 伦 勋 爵 笔 下 为 人 称 道 的 乐 土 并 因 此 为 外 国 人 所 熟 知',
  '_': '向 | 北 | 可 | 轻 | 松 | 抵 | 达 | 浪 | 漫 | 迷 | 人 | 的 | 辛 | 特 | 拉 | 镇 | 它 | 是 | 拜 | 伦 | 勋 | 爵 | 笔 | 下 | 为 | 人 | 称 | 道 | 的 | 乐 | 土 | 并 | 因 | 此 | 为 | 外 | 国 | 人 | 所 | 熟 | 知 |',
  'num_samples': 161280,
  'gender': 'FEMALE'},
 {'id': 1950,
  'file_name': '15504909343560718463.wav',
  'raw_transcription': '向北可轻松抵达浪漫迷人的辛特拉镇;它是拜伦勋爵笔下为人称道的乐土,并因此为外国人所熟知。',
  'transcription': '向 北 可 轻 松 抵 达 浪 漫 迷 人 的 辛 特 拉 镇 它 是 拜 伦 勋 爵 笔 下 为 人 称 道 的 乐 土 并 因 此 为 外 国 人 所 熟 知',
  '_': '向 | 北 | 可 | 轻 | 松 | 抵 | 达 | 浪 | 漫 | 迷 | 人 | 的 | 辛 | 特 | 拉 | 镇 | 它 | 是 | 拜 | 伦 | 勋 | 爵 | 笔 | 下 | 为 | 人 | 称 | 道 | 的 | 乐 | 土 | 并 | 因 | 此 | 为 | 外 | 国 | 人 | 所 | 熟 | 知 |',
  'num_samples': 146880,
  'gender': 'FEMALE'},
 {'id': 1944,
  'file_name': '16705490958141751403.wav',
  'raw_transcription': '这些海滩有时挤满了度假的家庭,沿岸排列着各种各样的商店。 游泳很安全。',
  'transcription': '这 些 海 滩 有 时 挤 满 了 度 假 的 家 庭 沿 岸 排 列 着 各 种 各 样 的 商 店 游 泳 很 安 全',
  '_': '这 | 些 | 海 | 滩 | 有 | 时 | 挤 | 满 | 了 | 度 | 假 | 的 | 家 | 庭 | 沿 | 岸 | 排 | 列 | 着 | 各 | 种 | 各 | 样 | 的 | 商 | 店 | 游 | 泳 | 很 | 安 | 全 |',
  'num_samples': 240000,
  'gender': 'MALE'},
 {'id': 1944,
  'file_name': '4524372327712807977.wav',
  'raw_transcription': '这些海滩有时挤满了度假的家庭,沿岸排列着各种各样的商店。 游泳很安全。',
  'transcription': '这 些 海 滩 有 时 挤 满 了 度 假 的 家 庭 沿 岸 排 列 着 各 种 各 样 的 商 店 游 泳 很 安 全',
  '_': '这 | 些 | 海 | 滩 | 有 | 时 | 挤 | 满 | 了 | 度 | 假 | 的 | 家 | 庭 | 沿 | 岸 | 排 | 列 | 着 | 各 | 种 | 各 | 样 | 的 | 商 | 店 | 游 | 泳 | 很 | 安 | 全 |',
  'num_samples': 174720,
  'gender': 'MALE'},
 {'id': 1944,
  'file_name': '6855861141429783495.wav',
  'raw_transcription': '这些海滩有时挤满了度假的家庭,沿岸排列着各种各样的商店。 游泳很安全。',
  'transcription': '这 些 海 滩 有 时 挤 满 了 度 假 的 家 庭 沿 岸 排 列 着 各 种 各 样 的 商 店 游 泳 很 安 全',
  '_': '这 | 些 | 海 | 滩 | 有 | 时 | 挤 | 满 | 了 | 度 | 假 | 的 | 家 | 庭 | 沿 | 岸 | 排 | 列 | 着 | 各 | 种 | 各 | 样 | 的 | 商 | 店 | 游 | 泳 | 很 | 安 | 全 |',
  'num_samples': 206080,
  'gender': 'MALE'},
 {'id': 1963,
  'file_name': '18413004844033577719.wav',
  'raw_transcription': '熨烫潮湿的衣服可以帮助其变干。即便房间并没有熨斗和熨衣板,但是许多酒店提供出借服务。',
  'transcription': '熨 烫 潮 湿 的 衣 服 可 以 帮 助 其 变 干 即 便 房 间 并 没 有 熨 斗 和 熨 衣 板 但 是 许 多 酒 店 提 供 出 借 服 务',
  '_': '熨 | 烫 | 潮 | 湿 | 的 | 衣 | 服 | 可 | 以 | 帮 | 助 | 其 | 变 | 干 | 即 | 便 | 房 | 间 | 并 | 没 | 有 | 熨 | 斗 | 和 | 熨 | 衣 | 板 | 但 | 是 | 许 | 多 | 酒 | 店 | 提 | 供 | 出 | 借 | 服 | 务 |',
  'num_samples': 250880,
  'gender': 'MALE'},
 {'id': 1963,
  'file_name': '7253631004853308791.wav',
  'raw_transcription': '熨烫潮湿的衣服可以帮助其变干。即便房间并没有熨斗和熨衣板,但是许多酒店提供出借服务。',
  'transcription': '熨 烫 潮 湿 的 衣 服 可 以 帮 助 其 变 干 即 便 房 间 并 没 有 熨 斗 和 熨 衣 板 但 是 许 多 酒 店 提 供 出 借 服 务',
  '_': '熨 | 烫 | 潮 | 湿 | 的 | 衣 | 服 | 可 | 以 | 帮 | 助 | 其 | 变 | 干 | 即 | 便 | 房 | 间 | 并 | 没 | 有 | 熨 | 斗 | 和 | 熨 | 衣 | 板 | 但 | 是 | 许 | 多 | 酒 | 店 | 提 | 供 | 出 | 借 | 服 | 务 |',
  'num_samples': 209280,
  'gender': 'MALE'},
 {'id': 1963,
  'file_name': '6686138590894179682.wav',
  'raw_transcription': '熨烫潮湿的衣服可以帮助其变干。即便房间并没有熨斗和熨衣板,但是许多酒店提供出借服务。',
  'transcription': '熨 烫 潮 湿 的 衣 服 可 以 帮 助 其 变 干 即 便 房 间 并 没 有 熨 斗 和 熨 衣 板 但 是 许 多 酒 店 提 供 出 借 服 务',
  '_': '熨 | 烫 | 潮 | 湿 | 的 | 衣 | 服 | 可 | 以 | 帮 | 助 | 其 | 变 | 干 | 即 | 便 | 房 | 间 | 并 | 没 | 有 | 熨 | 斗 | 和 | 熨 | 衣 | 板 | 但 | 是 | 许 | 多 | 酒 | 店 | 提 | 供 | 出 | 借 | 服 | 务 |',
  'num_samples': 152640,
  'gender': 'FEMALE'},
 {'id': 1743,
  'file_name': '15462612773581040714.wav',
  'raw_transcription': '大多数对技术决定论的解释都包括这两个总体思路:一是技术本身的发展在很大程度上超越了文化或政治影响,二是技术反过来会对社会产生不受社会条件制约的内在“影响”。',
  'transcription': '大 多 数 对 技 术 决 定 论 的 解 释 都 包 括 这 两 个 总 体 思 路 一 是 技 术 本 身 的 发 展 在 很 大 程 度 上 超 越 了 文 化 或 政 治 影 响 二 是 技 术 反 过 来 会 对 社 会 产 生 不 受 社 会 条 件 制 约 的 内 在 影 响',
  '_': '大 | 多 | 数 | 对 | 技 | 术 | 决 | 定 | 论 | 的 | 解 | 释 | 都 | 包 | 括 | 这 | 两 | 个 | 总 | 体 | 思 | 路 | 一 | 是 | 技 | 术 | 本 | 身 | 的 | 发 | 展 | 在 | 很 | 大 | 程 | 度 | 上 | 超 | 越 | 了 | 文 | 化 | 或 | 政 | 治 | 影 | 响 | 二 | 是 | 技 | 术 | 反 | 过 | 来 | 会 | 对 | 社 | 会 | 产 | 生 | 不 | 受 | 社 | 会 | 条 | 件 | 制 | 约 | 的 | 内 | 在 | 影 | 响 |',
  'num_samples': 283200,
  'gender': 'MALE'},
 {'id': 1743,
  'file_name': '8562991075439140308.wav',
  'raw_transcription': '大多数对技术决定论的解释都包括这两个总体思路:一是技术本身的发展在很大程度上超越了文化或政治影响,二是技术反过来会对社会产生不受社会条件制约的内在“影响”。',
  'transcription': '大 多 数 对 技 术 决 定 论 的 解 释 都 包 括 这 两 个 总 体 思 路 一 是 技 术 本 身 的 发 展 在 很 大 程 度 上 超 越 了 文 化 或 政 治 影 响 二 是 技 术 反 过 来 会 对 社 会 产 生 不 受 社 会 条 件 制 约 的 内 在 影 响',
  '_': '大 | 多 | 数 | 对 | 技 | 术 | 决 | 定 | 论 | 的 | 解 | 释 | 都 | 包 | 括 | 这 | 两 | 个 | 总 | 体 | 思 | 路 | 一 | 是 | 技 | 术 | 本 | 身 | 的 | 发 | 展 | 在 | 很 | 大 | 程 | 度 | 上 | 超 | 越 | 了 | 文 | 化 | 或 | 政 | 治 | 影 | 响 | 二 | 是 | 技 | 术 | 反 | 过 | 来 | 会 | 对 | 社 | 会 | 产 | 生 | 不 | 受 | 社 | 会 | 条 | 件 | 制 | 约 | 的 | 内 | 在 | 影 | 响 |',
  'num_samples': 241920,
  'gender': 'FEMALE'},
 {'id': 1743,
  'file_name': '4670237890473852788.wav',
  'raw_transcription': '大多数对技术决定论的解释都包括这两个总体思路:一是技术本身的发展在很大程度上超越了文化或政治影响,二是技术反过来会对社会产生不受社会条件制约的内在“影响”。',
  'transcription': '大 多 数 对 技 术 决 定 论 的 解 释 都 包 括 这 两 个 总 体 思 路 一 是 技 术 本 身 的 发 展 在 很 大 程 度 上 超 越 了 文 化 或 政 治 影 响 二 是 技 术 反 过 来 会 对 社 会 产 生 不 受 社 会 条 件 制 约 的 内 在 影 响',
  '_': '大 | 多 | 数 | 对 | 技 | 术 | 决 | 定 | 论 | 的 | 解 | 释 | 都 | 包 | 括 | 这 | 两 | 个 | 总 | 体 | 思 | 路 | 一 | 是 | 技 | 术 | 本 | 身 | 的 | 发 | 展 | 在 | 很 | 大 | 程 | 度 | 上 | 超 | 越 | 了 | 文 | 化 | 或 | 政 | 治 | 影 | 响 | 二 | 是 | 技 | 术 | 反 | 过 | 来 | 会 | 对 | 社 | 会 | 产 | 生 | 不 | 受 | 社 | 会 | 条 | 件 | 制 | 约 | 的 | 内 | 在 | 影 | 响 |',
  'num_samples': 337280,
  'gender': 'MALE'},
 {'id': 1896,
  'file_name': '207141767713642945.wav',
  'raw_transcription': '美国体操协会和美国奥委会有一个共同的目标,那就是尽可能保证体操运动和其他运动的安全性,让运动员在安全、积极和充满支持的环境中追求他们的梦想。',
  'transcription': '美 国 体 操 协 会 和 美 国 奥 委 会 有 一 个 共 同 的 目 标 那 就 是 尽 可 能 保 证 体 操 运 动 和 其 他 运 动 的 安 全 性 让 运 动 员 在 安 全 积 极 和 充 满 支 持 的 环 境 中 追 求 他 们 的 梦 想',
  '_': '美 | 国 | 体 | 操 | 协 | 会 | 和 | 美 | 国 | 奥 | 委 | 会 | 有 | 一 | 个 | 共 | 同 | 的 | 目 | 标 | 那 | 就 | 是 | 尽 | 可 | 能 | 保 | 证 | 体 | 操 | 运 | 动 | 和 | 其 | 他 | 运 | 动 | 的 | 安 | 全 | 性 | 让 | 运 | 动 | 员 | 在 | 安 | 全 | 积 | 极 | 和 | 充 | 满 | 支 | 持 | 的 | 环 | 境 | 中 | 追 | 求 | 他 | 们 | 的 | 梦 | 想 |',
  'num_samples': 265920,
  'gender': 'MALE'},
 {'id': 1896,
  'file_name': '9736239827496840219.wav',
  'raw_transcription': '美国体操协会和美国奥委会有一个共同的目标,那就是尽可能保证体操运动和其他运动的安全性,让运动员在安全、积极和充满支持的环境中追求他们的梦想。',
  'transcription': '美 国 体 操 协 会 和 美 国 奥 委 会 有 一 个 共 同 的 目 标 那 就 是 尽 可 能 保 证 体 操 运 动 和 其 他 运 动 的 安 全 性 让 运 动 员 在 安 全 积 极 和 充 满 支 持 的 环 境 中 追 求 他 们 的 梦 想',
  '_': '美 | 国 | 体 | 操 | 协 | 会 | 和 | 美 | 国 | 奥 | 委 | 会 | 有 | 一 | 个 | 共 | 同 | 的 | 目 | 标 | 那 | 就 | 是 | 尽 | 可 | 能 | 保 | 证 | 体 | 操 | 运 | 动 | 和 | 其 | 他 | 运 | 动 | 的 | 安 | 全 | 性 | 让 | 运 | 动 | 员 | 在 | 安 | 全 | 积 | 极 | 和 | 充 | 满 | 支 | 持 | 的 | 环 | 境 | 中 | 追 | 求 | 他 | 们 | 的 | 梦 | 想 |',
  'num_samples': 242560,
  'gender': 'MALE'},
 {'id': 1768,
  'file_name': '1606492493443666354.wav',
  'raw_transcription': '为了让游客更好地了解建筑群的原貌,该建筑群边缘的大部分建筑都经过重建。',
  'transcription': '为 了 让 游 客 更 好 地 了 解 建 筑 群 的 原 貌 该 建 筑 群 边 缘 的 大 部 分 建 筑 都 经 过 重 建',
  '_': '为 | 了 | 让 | 游 | 客 | 更 | 好 | 地 | 了 | 解 | 建 | 筑 | 群 | 的 | 原 | 貌 | 该 | 建 | 筑 | 群 | 边 | 缘 | 的 | 大 | 部 | 分 | 建 | 筑 | 都 | 经 | 过 | 重 | 建 |',
  'num_samples': 214720,
  'gender': 'MALE'},
 {'id': 1768,
  'file_name': '9764153938452424185.wav',
  'raw_transcription': '为了让游客更好地了解建筑群的原貌,该建筑群边缘的大部分建筑都经过重建。',
  'transcription': '为 了 让 游 客 更 好 地 了 解 建 筑 群 的 原 貌 该 建 筑 群 边 缘 的 大 部 分 建 筑 都 经 过 重 建',
  '_': '为 | 了 | 让 | 游 | 客 | 更 | 好 | 地 | 了 | 解 | 建 | 筑 | 群 | 的 | 原 | 貌 | 该 | 建 | 筑 | 群 | 边 | 缘 | 的 | 大 | 部 | 分 | 建 | 筑 | 都 | 经 | 过 | 重 | 建 |',
  'num_samples': 275520,
  'gender': 'MALE'},
 {'id': 1768,
  'file_name': '6338490837497081532.wav',
  'raw_transcription': '为了让游客更好地了解建筑群的原貌,该建筑群边缘的大部分建筑都经过重建。',
  'transcription': '为 了 让 游 客 更 好 地 了 解 建 筑 群 的 原 貌 该 建 筑 群 边 缘 的 大 部 分 建 筑 都 经 过 重 建',
  '_': '为 | 了 | 让 | 游 | 客 | 更 | 好 | 地 | 了 | 解 | 建 | 筑 | 群 | 的 | 原 | 貌 | 该 | 建 | 筑 | 群 | 边 | 缘 | 的 | 大 | 部 | 分 | 建 | 筑 | 都 | 经 | 过 | 重 | 建 |',
  'num_samples': 213760,
  'gender': 'MALE'},
 {'id': 1854,
  'file_name': '6735471425702786619.wav',
  'raw_transcription': '当天,格林尼治时间 (GMT) 约 12 时许,该车辆被拖离事故现场。',
  'transcription': '当 天 格 林 尼 治 时 间 gmt 约 12 时 许 该 车 辆 被 拖 离 事 故 现 场',
  '_': '当 | 天 | 格 | 林 | 尼 | 治 | 时 | 间 | g m t | 约 | 1 2 | 时 | 许 | 该 | 车 | 辆 | 被 | 拖 | 离 | 事 | 故 | 现 | 场 |',
  'num_samples': 106560,
  'gender': 'FEMALE'},
 {'id': 1854,
  'file_name': '16077084420123534564.wav',
  'raw_transcription': '当天,格林尼治时间 (GMT) 约 12 时许,该车辆被拖离事故现场。',
  'transcription': '当 天 格 林 尼 治 时 间 gmt 约 12 时 许 该 车 辆 被 拖 离 事 故 现 场',
  '_': '当 | 天 | 格 | 林 | 尼 | 治 | 时 | 间 | g m t | 约 | 1 2 | 时 | 许 | 该 | 车 | 辆 | 被 | 拖 | 离 | 事 | 故 | 现 | 场 |',
  'num_samples': 214080,
  'gender': 'MALE'},
 {'id': 1854,
  'file_name': '9034957386691154053.wav',
  'raw_transcription': '当天,格林尼治时间 (GMT) 约 12 时许,该车辆被拖离事故现场。',
  'transcription': '当 天 格 林 尼 治 时 间 gmt 约 12 时 许 该 车 辆 被 拖 离 事 故 现 场',
  '_': '当 | 天 | 格 | 林 | 尼 | 治 | 时 | 间 | g m t | 约 | 1 2 | 时 | 许 | 该 | 车 | 辆 | 被 | 拖 | 离 | 事 | 故 | 现 | 场 |',
  'num_samples': 115200,
  'gender': 'FEMALE'},
 {'id': 1901,
  'file_name': '14521504222934061665.wav',
  'raw_transcription': '人工智能有很强的科幻色彩,但它其实是计算机科学非常重要的一个分支,研究的是机器的行为、学习和智能适应。',
  'transcription': '人 工 智 能 有 很 强 的 科 幻 色 彩 但 它 其 实 是 计 算 机 科 学 非 常 重 要 的 一 个 分 支 研 究 的 是 机 器 的 行 为 学 习 和 智 能 适 应',
  '_': '人 | 工 | 智 | 能 | 有 | 很 | 强 | 的 | 科 | 幻 | 色 | 彩 | 但 | 它 | 其 | 实 | 是 | 计 | 算 | 机 | 科 | 学 | 非 | 常 | 重 | 要 | 的 | 一 | 个 | 分 | 支 | 研 | 究 | 的 | 是 | 机 | 器 | 的 | 行 | 为 | 学 | 习 | 和 | 智 | 能 | 适 | 应 |',
  'num_samples': 178560,
  'gender': 'MALE'},
 {'id': 1901,
  'file_name': '6919704351538265841.wav',
  'raw_transcription': '人工智能有很强的科幻色彩,但它其实是计算机科学非常重要的一个分支,研究的是机器的行为、学习和智能适应。',
  'transcription': '人 工 智 能 有 很 强 的 科 幻 色 彩 但 它 其 实 是 计 算 机 科 学 非 常 重 要 的 一 个 分 支 研 究 的 是 机 器 的 行 为 学 习 和 智 能 适 应',
  '_': '人 | 工 | 智 | 能 | 有 | 很 | 强 | 的 | 科 | 幻 | 色 | 彩 | 但 | 它 | 其 | 实 | 是 | 计 | 算 | 机 | 科 | 学 | 非 | 常 | 重 | 要 | 的 | 一 | 个 | 分 | 支 | 研 | 究 | 的 | 是 | 机 | 器 | 的 | 行 | 为 | 学 | 习 | 和 | 智 | 能 | 适 | 应 |',
  'num_samples': 273600,
  'gender': 'MALE'},
 {'id': 1901,
  'file_name': '625155272992722331.wav',
  'raw_transcription': '人工智能有很强的科幻色彩,但它其实是计算机科学非常重要的一个分支,研究的是机器的行为、学习和智能适应。',
  'transcription': '人 工 智 能 有 很 强 的 科 幻 色 彩 但 它 其 实 是 计 算 机 科 学 非 常 重 要 的 一 个 分 支 研 究 的 是 机 器 的 行 为 学 习 和 智 能 适 应',
  '_': '人 | 工 | 智 | 能 | 有 | 很 | 强 | 的 | 科 | 幻 | 色 | 彩 | 但 | 它 | 其 | 实 | 是 | 计 | 算 | 机 | 科 | 学 | 非 | 常 | 重 | 要 | 的 | 一 | 个 | 分 | 支 | 研 | 究 | 的 | 是 | 机 | 器 | 的 | 行 | 为 | 学 | 习 | 和 | 智 | 能 | 适 | 应 |',
  'num_samples': 216000,
  'gender': 'MALE'},
 {'id': 1987,
  'file_name': '6022804548536884905.wav',
  'raw_transcription': '坠机发生在高海拔山区,据称是敌方火力所致。',
  'transcription': '坠 机 发 生 在 高 海 拔 山 区 据 称 是 敌 方 火 力 所 致',
  '_': '坠 | 机 | 发 | 生 | 在 | 高 | 海 | 拔 | 山 | 区 | 据 | 称 | 是 | 敌 | 方 | 火 | 力 | 所 | 致 |',
  'num_samples': 87360,
  'gender': 'FEMALE'},
 {'id': 1987,
  'file_name': '130847975543788428.wav',
  'raw_transcription': '坠机发生在高海拔山区,据称是敌方火力所致。',
  'transcription': '坠 机 发 生 在 高 海 拔 山 区 据 称 是 敌 方 火 力 所 致',
  '_': '坠 | 机 | 发 | 生 | 在 | 高 | 海 | 拔 | 山 | 区 | 据 | 称 | 是 | 敌 | 方 | 火 | 力 | 所 | 致 |',
  'num_samples': 163200,
  'gender': 'MALE'},
 {'id': 1987,
  'file_name': '5473826726739727303.wav',
  'raw_transcription': '坠机发生在高海拔山区,据称是敌方火力所致。',
  'transcription': '坠 机 发 生 在 高 海 拔 山 区 据 称 是 敌 方 火 力 所 致',
  '_': '坠 | 机 | 发 | 生 | 在 | 高 | 海 | 拔 | 山 | 区 | 据 | 称 | 是 | 敌 | 方 | 火 | 力 | 所 | 致 |',
  'num_samples': 76800,
  'gender': 'FEMALE'},
 {'id': 2009,
  'file_name': '7621495799107471411.wav',
  'raw_transcription': '最容易获得的植物性资源应该是叶子和豆科植物中的蛋白质,但像我们这样的灵长类动物很难消化这种蛋白质,除非是煮熟的。',
  'transcription': '最 容 易 获 得 的 植 物 性 资 源 应 该 是 叶 子 和 豆 科 植 物 中 的 蛋 白 质 但 像 我 们 这 样 的 灵 长 类 动 物 很 难 消 化 这 种 蛋 白 质 除 非 是 煮 熟 的',
  '_': '最 | 容 | 易 | 获 | 得 | 的 | 植 | 物 | 性 | 资 | 源 | 应 | 该 | 是 | 叶 | 子 | 和 | 豆 | 科 | 植 | 物 | 中 | 的 | 蛋 | 白 | 质 | 但 | 像 | 我 | 们 | 这 | 样 | 的 | 灵 | 长 | 类 | 动 | 物 | 很 | 难 | 消 | 化 | 这 | 种 | 蛋 | 白 | 质 | 除 | 非 | 是 | 煮 | 熟 | 的 |',
  'num_samples': 227520,
  'gender': 'MALE'},
 {'id': 2009,
  'file_name': '3616010404551000657.wav',
  'raw_transcription': '最容易获得的植物性资源应该是叶子和豆科植物中的蛋白质,但像我们这样的灵长类动物很难消化这种蛋白质,除非是煮熟的。',
  'transcription': '最 容 易 获 得 的 植 物 性 资 源 应 该 是 叶 子 和 豆 科 植 物 中 的 蛋 白 质 但 像 我 们 这 样 的 灵 长 类 动 物 很 难 消 化 这 种 蛋 白 质 除 非 是 煮 熟 的',
  '_': '最 | 容 | 易 | 获 | 得 | 的 | 植 | 物 | 性 | 资 | 源 | 应 | 该 | 是 | 叶 | 子 | 和 | 豆 | 科 | 植 | 物 | 中 | 的 | 蛋 | 白 | 质 | 但 | 像 | 我 | 们 | 这 | 样 | 的 | 灵 | 长 | 类 | 动 | 物 | 很 | 难 | 消 | 化 | 这 | 种 | 蛋 | 白 | 质 | 除 | 非 | 是 | 煮 | 熟 | 的 |',
  'num_samples': 188160,
  'gender': 'FEMALE'},
 {'id': 1956,
  'file_name': '4545927783250873766.wav',
  'raw_transcription': '迄今为止,船运是跨洋运输大量人员和货物的最有效方式。',
  'transcription': '迄 今 为 止 船 运 是 跨 洋 运 输 大 量 人 员 和 货 物 的 最 有 效 方 式',
  '_': '迄 | 今 | 为 | 止 | 船 | 运 | 是 | 跨 | 洋 | 运 | 输 | 大 | 量 | 人 | 员 | 和 | 货 | 物 | 的 | 最 | 有 | 效 | 方 | 式 |',
  'num_samples': 98880,
  'gender': 'FEMALE'},
 {'id': 1956,
  'file_name': '13864652053998339021.wav',
  'raw_transcription': '迄今为止,船运是跨洋运输大量人员和货物的最有效方式。',
  'transcription': '迄 今 为 止 船 运 是 跨 洋 运 输 大 量 人 员 和 货 物 的 最 有 效 方 式',
  '_': '迄 | 今 | 为 | 止 | 船 | 运 | 是 | 跨 | 洋 | 运 | 输 | 大 | 量 | 人 | 员 | 和 | 货 | 物 | 的 | 最 | 有 | 效 | 方 | 式 |',
  'num_samples': 222080,
  'gender': 'MALE'},
 {'id': 1956,
  'file_name': '2143864787210000265.wav',
  'raw_transcription': '迄今为止,船运是跨洋运输大量人员和货物的最有效方式。',
  'transcription': '迄 今 为 止 船 运 是 跨 洋 运 输 大 量 人 员 和 货 物 的 最 有 效 方 式',
  '_': '迄 | 今 | 为 | 止 | 船 | 运 | 是 | 跨 | 洋 | 运 | 输 | 大 | 量 | 人 | 员 | 和 | 货 | 物 | 的 | 最 | 有 | 效 | 方 | 式 |',
  'num_samples': 230720,
  'gender': 'MALE'},
 {'id': 1705,
  'file_name': '5940142723486855015.wav',
  'raw_transcription': '1940 年 8 月 15 日,盟军攻入法国南部,这次进攻被称为“龙骑兵行动”。',
  'transcription': '1940 年 8 月 15 日 盟 军 攻 入 法 国 南 部 这 次 进 攻 被 称 为 龙 骑 兵 行 动',
  '_': '1 9 4 0 | 年 | 8 | 月 | 1 5 | 日 | 盟 | 军 | 攻 | 入 | 法 | 国 | 南 | 部 | 这 | 次 | 进 | 攻 | 被 | 称 | 为 | 龙 | 骑 | 兵 | 行 | 动 |',
  'num_samples': 152640,
  'gender': 'MALE'},
 {'id': 1705,
  'file_name': '11338778690242874435.wav',
  'raw_transcription': '1940 年 8 月 15 日,盟军攻入法国南部,这次进攻被称为“龙骑兵行动”。',
  'transcription': '1940 年 8 月 15 日 盟 军 攻 入 法 国 南 部 这 次 进 攻 被 称 为 龙 骑 兵 行 动',
  '_': '1 9 4 0 | 年 | 8 | 月 | 1 5 | 日 | 盟 | 军 | 攻 | 入 | 法 | 国 | 南 | 部 | 这 | 次 | 进 | 攻 | 被 | 称 | 为 | 龙 | 骑 | 兵 | 行 | 动 |',
  'num_samples': 115200,
  'gender': 'FEMALE'},
 {'id': 1705,
  'file_name': '17091883959967348718.wav',
  'raw_transcription': '1940 年 8 月 15 日,盟军攻入法国南部,这次进攻被称为“龙骑兵行动”。',
  'transcription': '1940 年 8 月 15 日 盟 军 攻 入 法 国 南 部 这 次 进 攻 被 称 为 龙 骑 兵 行 动',
  '_': '1 9 4 0 | 年 | 8 | 月 | 1 5 | 日 | 盟 | 军 | 攻 | 入 | 法 | 国 | 南 | 部 | 这 | 次 | 进 | 攻 | 被 | 称 | 为 | 龙 | 骑 | 兵 | 行 | 动 |',
  'num_samples': 251200,
  'gender': 'MALE'},
 {'id': 1729,
  'file_name': '10777625043982141593.wav',
  'raw_transcription': '例如,北卡罗莱纳州本尼特学校 ( Bennet School) 的学生每年都会设计一个有关他们的州府之行的网站。网站每年都会重新设计,但是老版本会在线保存,用作剪贴簿。',
  'transcription': '例 如 北 卡 罗 莱 纳 州 本 尼 特 学 校 bennet school 的 学 生 每 年 都 会 设 计 一 个 有 关 他 们 的 州 府 之 行 的 网 站 网 站 每 年 都 会 重 新 设 计 但 是 老 版 本 会 在 线 保 存 用 作 剪 贴 簿',
  '_': '例 | 如 | 北 | 卡 | 罗 | 莱 | 纳 | 州 | 本 | 尼 | 特 | 学 | 校 | b e n n e t | s c h o o l | 的 | 学 | 生 | 每 | 年 | 都 | 会 | 设 | 计 | 一 | 个 | 有 | 关 | 他 | 们 | 的 | 州 | 府 | 之 | 行 | 的 | 网 | 站 | 网 | 站 | 每 | 年 | 都 | 会 | 重 | 新 | 设 | 计 | 但 | 是 | 老 | 版 | 本 | 会 | 在 | 线 | 保 | 存 | 用 | 作 | 剪 | 贴 | 簿 |',
  'num_samples': 281280,
  'gender': 'MALE'},
 {'id': 1729,
  'file_name': '14823407203685877802.wav',
  'raw_transcription': '例如,北卡罗莱纳州本尼特学校 ( Bennet School) 的学生每年都会设计一个有关他们的州府之行的网站。网站每年都会重新设计,但是老版本会在线保存,用作剪贴簿。',
  'transcription': '例 如 北 卡 罗 莱 纳 州 本 尼 特 学 校 bennet school 的 学 生 每 年 都 会 设 计 一 个 有 关 他 们 的 州 府 之 行 的 网 站 网 站 每 年 都 会 重 新 设 计 但 是 老 版 本 会 在 线 保 存 用 作 剪 贴 簿',
  '_': '例 | 如 | 北 | 卡 | 罗 | 莱 | 纳 | 州 | 本 | 尼 | 特 | 学 | 校 | b e n n e t | s c h o o l | 的 | 学 | 生 | 每 | 年 | 都 | 会 | 设 | 计 | 一 | 个 | 有 | 关 | 他 | 们 | 的 | 州 | 府 | 之 | 行 | 的 | 网 | 站 | 网 | 站 | 每 | 年 | 都 | 会 | 重 | 新 | 设 | 计 | 但 | 是 | 老 | 版 | 本 | 会 | 在 | 线 | 保 | 存 | 用 | 作 | 剪 | 贴 | 簿 |',
  'num_samples': 309440,
  'gender': 'MALE'},
 {'id': 1921,
  'file_name': '6165075291705354206.wav',
  'raw_transcription': '另一方面,冰雪天气在很多国家都十分常见,全年交通也几乎不会中断。',
  'transcription': '另 一 方 面 冰 雪 天 气 在 很 多 国 家 都 十 分 常 见 全 年 交 通 也 几 乎 不 会 中 断',
  '_': '另 | 一 | 方 | 面 | 冰 | 雪 | 天 | 气 | 在 | 很 | 多 | 国 | 家 | 都 | 十 | 分 | 常 | 见 | 全 | 年 | 交 | 通 | 也 | 几 | 乎 | 不 | 会 | 中 | 断 |',
  'num_samples': 138240,
  'gender': 'MALE'},
 {'id': 1921,
  'file_name': '14674897738593297544.wav',
  'raw_transcription': '另一方面,冰雪天气在很多国家都十分常见,全年交通也几乎不会中断。',
  'transcription': '另 一 方 面 冰 雪 天 气 在 很 多 国 家 都 十 分 常 见 全 年 交 通 也 几 乎 不 会 中 断',
  '_': '另 | 一 | 方 | 面 | 冰 | 雪 | 天 | 气 | 在 | 很 | 多 | 国 | 家 | 都 | 十 | 分 | 常 | 见 | 全 | 年 | 交 | 通 | 也 | 几 | 乎 | 不 | 会 | 中 | 断 |',
  'num_samples': 101760,
  'gender': 'FEMALE'},
 {'id': 1863,
  'file_name': '6272673678285320999.wav',
  'raw_transcription': '西藏冥想的核心活动是天瑜伽。通过把不同的神形象化,净化能量通道,激活轮穴,从而达到顿悟的境界。',
  'transcription': '西 藏 冥 想 的 核 心 活 动 是 天 瑜 伽 通 过 把 不 同 的 神 形 象 化 净 化 能 量 通 道 激 活 轮 穴 从 而 达 到 顿 悟 的 境 界',
  '_': '西 | 藏 | 冥 | 想 | 的 | 核 | 心 | 活 | 动 | 是 | 天 | 瑜 | 伽 | 通 | 过 | 把 | 不 | 同 | 的 | 神 | 形 | 象 | 化 | 净 | 化 | 能 | 量 | 通 | 道 | 激 | 活 | 轮 | 穴 | 从 | 而 | 达 | 到 | 顿 | 悟 | 的 | 境 | 界 |',
  'num_samples': 168960,
  'gender': 'FEMALE'},
 {'id': 1863,
  'file_name': '16806523488937027240.wav',
  'raw_transcription': '西藏冥想的核心活动是天瑜伽。通过把不同的神形象化,净化能量通道,激活轮穴,从而达到顿悟的境界。',
  'transcription': '西 藏 冥 想 的 核 心 活 动 是 天 瑜 伽 通 过 把 不 同 的 神 形 象 化 净 化 能 量 通 道 激 活 轮 穴 从 而 达 到 顿 悟 的 境 界',
  '_': '西 | 藏 | 冥 | 想 | 的 | 核 | 心 | 活 | 动 | 是 | 天 | 瑜 | 伽 | 通 | 过 | 把 | 不 | 同 | 的 | 神 | 形 | 象 | 化 | 净 | 化 | 能 | 量 | 通 | 道 | 激 | 活 | 轮 | 穴 | 从 | 而 | 达 | 到 | 顿 | 悟 | 的 | 境 | 界 |',
  'num_samples': 152640,
  'gender': 'FEMALE'},
 {'id': 1863,
  'file_name': '5976022745768540672.wav',
  'raw_transcription': '西藏冥想的核心活动是天瑜伽。通过把不同的神形象化,净化能量通道,激活轮穴,从而达到顿悟的境界。',
  'transcription': '西 藏 冥 想 的 核 心 活 动 是 天 瑜 伽 通 过 把 不 同 的 神 形 象 化 净 化 能 量 通 道 激 活 轮 穴 从 而 达 到 顿 悟 的 境 界',
  '_': '西 | 藏 | 冥 | 想 | 的 | 核 | 心 | 活 | 动 | 是 | 天 | 瑜 | 伽 | 通 | 过 | 把 | 不 | 同 | 的 | 神 | 形 | 象 | 化 | 净 | 化 | 能 | 量 | 通 | 道 | 激 | 活 | 轮 | 穴 | 从 | 而 | 达 | 到 | 顿 | 悟 | 的 | 境 | 界 |',
  'num_samples': 147840,
  'gender': 'FEMALE'},
 {'id': 1730,
  'file_name': '16122645321793286284.wav',
  'raw_transcription': '全天都有公交车从城区间公交站(跨河)发车,但大部分车次,特别是开往东部和贾卡尔/布姆唐的公交车都在 06:30 至 07:30 之间发车。',
  'transcription': '全 天 都 有 公 交 车 从 城 区 间 公 交 站 跨 河 发 车 但 大 部 分 车 次 特 别 是 开 往 东 部 和 贾 卡 尔 布 姆 唐 的 公 交 车 都 在 06:30 至 07:30 之 间 发 车',
  '_': '全 | 天 | 都 | 有 | 公 | 交 | 车 | 从 | 城 | 区 | 间 | 公 | 交 | 站 | 跨 | 河 | 发 | 车 | 但 | 大 | 部 | 分 | 车 | 次 | 特 | 别 | 是 | 开 | 往 | 东 | 部 | 和 | 贾 | 卡 | 尔 | 布 | 姆 | 唐 | 的 | 公 | 交 | 车 | 都 | 在 | 0 6 : 3 0 | 至 | 0 7 : 3 0 | 之 | 间 | 发 | 车 |',
  'num_samples': 276480,
  'gender': 'MALE'},
 {'id': 1730,
  'file_name': '9268582573288932440.wav',
  'raw_transcription': '全天都有公交车从城区间公交站(跨河)发车,但大部分车次,特别是开往东部和贾卡尔/布姆唐的公交车都在 06:30 至 07:30 之间发车。',
  'transcription': '全 天 都 有 公 交 车 从 城 区 间 公 交 站 跨 河 发 车 但 大 部 分 车 次 特 别 是 开 往 东 部 和 贾 卡 尔 布 姆 唐 的 公 交 车 都 在 06:30 至 07:30 之 间 发 车',
  '_': '全 | 天 | 都 | 有 | 公 | 交 | 车 | 从 | 城 | 区 | 间 | 公 | 交 | 站 | 跨 | 河 | 发 | 车 | 但 | 大 | 部 | 分 | 车 | 次 | 特 | 别 | 是 | 开 | 往 | 东 | 部 | 和 | 贾 | 卡 | 尔 | 布 | 姆 | 唐 | 的 | 公 | 交 | 车 | 都 | 在 | 0 6 : 3 0 | 至 | 0 7 : 3 0 | 之 | 间 | 发 | 车 |',
  'num_samples': 235200,
  'gender': 'FEMALE'},
 {'id': 1730,
  'file_name': '8827463657767496568.wav',
  'raw_transcription': '全天都有公交车从城区间公交站(跨河)发车,但大部分车次,特别是开往东部和贾卡尔/布姆唐的公交车都在 06:30 至 07:30 之间发车。',
  'transcription': '全 天 都 有 公 交 车 从 城 区 间 公 交 站 跨 河 发 车 但 大 部 分 车 次 特 别 是 开 往 东 部 和 贾 卡 尔 布 姆 唐 的 公 交 车 都 在 06:30 至 07:30 之 间 发 车',
  '_': '全 | 天 | 都 | 有 | 公 | 交 | 车 | 从 | 城 | 区 | 间 | 公 | 交 | 站 | 跨 | 河 | 发 | 车 | 但 | 大 | 部 | 分 | 车 | 次 | 特 | 别 | 是 | 开 | 往 | 东 | 部 | 和 | 贾 | 卡 | 尔 | 布 | 姆 | 唐 | 的 | 公 | 交 | 车 | 都 | 在 | 0 6 : 3 0 | 至 | 0 7 : 3 0 | 之 | 间 | 发 | 车 |',
  'num_samples': 329280,
  'gender': 'MALE'},
 {'id': 1808,
  'file_name': '3528569971378894058.wav',
  'raw_transcription': '战争结束两年后,曾经的盟友如今成了敌人,冷战随即开始。',
  'transcription': '战 争 结 束 两 年 后 曾 经 的 盟 友 如 今 成 了 敌 人 冷 战 随 即 开 始',
  '_': '战 | 争 | 结 | 束 | 两 | 年 | 后 | 曾 | 经 | 的 | 盟 | 友 | 如 | 今 | 成 | 了 | 敌 | 人 | 冷 | 战 | 随 | 即 | 开 | 始 |',
  'num_samples': 97920,
  'gender': 'FEMALE'},
 {'id': 1808,
  'file_name': '10700749092778973179.wav',
  'raw_transcription': '战争结束两年后,曾经的盟友如今成了敌人,冷战随即开始。',
  'transcription': '战 争 结 束 两 年 后 曾 经 的 盟 友 如 今 成 了 敌 人 冷 战 随 即 开 始',
  '_': '战 | 争 | 结 | 束 | 两 | 年 | 后 | 曾 | 经 | 的 | 盟 | 友 | 如 | 今 | 成 | 了 | 敌 | 人 | 冷 | 战 | 随 | 即 | 开 | 始 |',
  'num_samples': 103680,
  'gender': 'FEMALE'},
 {'id': 1808,
  'file_name': '17659474819024581709.wav',
  'raw_transcription': '战争结束两年后,曾经的盟友如今成了敌人,冷战随即开始。',
  'transcription': '战 争 结 束 两 年 后 曾 经 的 盟 友 如 今 成 了 敌 人 冷 战 随 即 开 始',
  '_': '战 | 争 | 结 | 束 | 两 | 年 | 后 | 曾 | 经 | 的 | 盟 | 友 | 如 | 今 | 成 | 了 | 敌 | 人 | 冷 | 战 | 随 | 即 | 开 | 始 |',
  'num_samples': 99840,
  'gender': 'FEMALE'},
 {'id': 1719,
  'file_name': '5784808260939700436.wav',
  'raw_transcription': '恶劣天气是任何危险天气现象的总称;这种天气会造成破坏、严重社会混乱或人员伤亡。',
  'transcription': '恶 劣 天 气 是 任 何 危 险 天 气 现 象 的 总 称 这 种 天 气 会 造 成 破 坏 严 重 社 会 混 乱 或 人 员 伤 亡',
  '_': '恶 | 劣 | 天 | 气 | 是 | 任 | 何 | 危 | 险 | 天 | 气 | 现 | 象 | 的 | 总 | 称 | 这 | 种 | 天 | 气 | 会 | 造 | 成 | 破 | 坏 | 严 | 重 | 社 | 会 | 混 | 乱 | 或 | 人 | 员 | 伤 | 亡 |',
  'num_samples': 273920,
  'gender': 'MALE'},
 {'id': 1719,
  'file_name': '2361100735374204762.wav',
  'raw_transcription': '恶劣天气是任何危险天气现象的总称;这种天气会造成破坏、严重社会混乱或人员伤亡。',
  'transcription': '恶 劣 天 气 是 任 何 危 险 天 气 现 象 的 总 称 这 种 天 气 会 造 成 破 坏 严 重 社 会 混 乱 或 人 员 伤 亡',
  '_': '恶 | 劣 | 天 | 气 | 是 | 任 | 何 | 危 | 险 | 天 | 气 | 现 | 象 | 的 | 总 | 称 | 这 | 种 | 天 | 气 | 会 | 造 | 成 | 破 | 坏 | 严 | 重 | 社 | 会 | 混 | 乱 | 或 | 人 | 员 | 伤 | 亡 |',
  'num_samples': 185280,
  'gender': 'MALE'},
 {'id': 1719,
  'file_name': '552132419391350219.wav',
  'raw_transcription': '恶劣天气是任何危险天气现象的总称;这种天气会造成破坏、严重社会混乱或人员伤亡。',
  'transcription': '恶 劣 天 气 是 任 何 危 险 天 气 现 象 的 总 称 这 种 天 气 会 造 成 破 坏 严 重 社 会 混 乱 或 人 员 伤 亡',
  '_': '恶 | 劣 | 天 | 气 | 是 | 任 | 何 | 危 | 险 | 天 | 气 | 现 | 象 | 的 | 总 | 称 | 这 | 种 | 天 | 气 | 会 | 造 | 成 | 破 | 坏 | 严 | 重 | 社 | 会 | 混 | 乱 | 或 | 人 | 员 | 伤 | 亡 |',
  'num_samples': 147840,
  'gender': 'MALE'},
 {'id': 1804,
  'file_name': '2625982748996855379.wav',
  'raw_transcription': '海地正义与民主研究所 (Haitian Institute for Justice and Democracy) 引用的独立研究表明,是尼泊尔的联合国维和部队在不知情的情况下将这种疾病带到了海地。',
  'transcription': '海 地 正 义 与 民 主 研 究 所 haitian institute for justice and democracy 引 用 的 独 立 研 究 表 明 是 尼 泊 尔 的 联 合 国 维 和 部 队 在 不 知 情 的 情 况 下 将 这 种 疾 病 带 到 了 海 地',
  '_': '海 | 地 | 正 | 义 | 与 | 民 | 主 | 研 | 究 | 所 | h a i t i a n | i n s t i t u t e | f o r | j u s t i c e | a n d | d e m o c r a c y | 引 | 用 | 的 | 独 | 立 | 研 | 究 | 表 | 明 | 是 | 尼 | 泊 | 尔 | 的 | 联 | 合 | 国 | 维 | 和 | 部 | 队 | 在 | 不 | 知 | 情 | 的 | 情 | 况 | 下 | 将 | 这 | 种 | 疾 | 病 | 带 | 到 | 了 | 海 | 地 |',
  'num_samples': 222720,
  'gender': 'MALE'},
 {'id': 1804,
  'file_name': '10604423531103587528.wav',
  'raw_transcription': '海地正义与民主研究所 (Haitian Institute for Justice and Democracy) 引用的独立研究表明,是尼泊尔的联合国维和部队在不知情的情况下将这种疾病带到了海地。',
  'transcription': '海 地 正 义 与 民 主 研 究 所 haitian institute for justice and democracy 引 用 的 独 立 研 究 表 明 是 尼 泊 尔 的 联 合 国 维 和 部 队 在 不 知 情 的 情 况 下 将 这 种 疾 病 带 到 了 海 地',
  '_': '海 | 地 | 正 | 义 | 与 | 民 | 主 | 研 | 究 | 所 | h a i t i a n | i n s t i t u t e | f o r | j u s t i c e | a n d | d e m o c r a c y | 引 | 用 | 的 | 独 | 立 | 研 | 究 | 表 | 明 | 是 | 尼 | 泊 | 尔 | 的 | 联 | 合 | 国 | 维 | 和 | 部 | 队 | 在 | 不 | 知 | 情 | 的 | 情 | 况 | 下 | 将 | 这 | 种 | 疾 | 病 | 带 | 到 | 了 | 海 | 地 |',
  'num_samples': 168000,
  'gender': 'FEMALE'},
 {'id': 1804,
  'file_name': '2810593509778229658.wav',
  'raw_transcription': '海地正义与民主研究所 (Haitian Institute for Justice and Democracy) 引用的独立研究表明,是尼泊尔的联合国维和部队在不知情的情况下将这种疾病带到了海地。',
  'transcription': '海 地 正 义 与 民 主 研 究 所 haitian institute for justice and democracy 引 用 的 独 立 研 究 表 明 是 尼 泊 尔 的 联 合 国 维 和 部 队 在 不 知 情 的 情 况 下 将 这 种 疾 病 带 到 了 海 地',
  '_': '海 | 地 | 正 | 义 | 与 | 民 | 主 | 研 | 究 | 所 | h a i t i a n | i n s t i t u t e | f o r | j u s t i c e | a n d | d e m o c r a c y | 引 | 用 | 的 | 独 | 立 | 研 | 究 | 表 | 明 | 是 | 尼 | 泊 | 尔 | 的 | 联 | 合 | 国 | 维 | 和 | 部 | 队 | 在 | 不 | 知 | 情 | 的 | 情 | 况 | 下 | 将 | 这 | 种 | 疾 | 病 | 带 | 到 | 了 | 海 | 地 |',
  'num_samples': 266240,
  'gender': 'MALE'},
 {'id': 1732,
  'file_name': '18436796112061237688.wav',
  'raw_transcription': '事件发生的时代通常被称为欧洲史的中世纪盛时,即的 11、12 和 13世纪时期(公元 1000-1300 年)。',
  'transcription': '事 件 发 生 的 时 代 通 常 被 称 为 欧 洲 史 的 中 世 纪 盛 时 即 的 11 12 和 13 世 纪 时 期 公 元 1000-1300 年',
  '_': '事 | 件 | 发 | 生 | 的 | 时 | 代 | 通 | 常 | 被 | 称 | 为 | 欧 | 洲 | 史 | 的 | 中 | 世 | 纪 | 盛 | 时 | 即 | 的 | 1 1 | 1 2 | 和 | 1 3 | 世 | 纪 | 时 | 期 | 公 | 元 | 1 0 0 0 - 1 3 0 0 | 年 |',
  'num_samples': 231360,
  'gender': 'MALE'},
 {'id': 1732,
  'file_name': '2140171322357814736.wav',
  'raw_transcription': '事件发生的时代通常被称为欧洲史的中世纪盛时,即的 11、12 和 13世纪时期(公元 1000-1300 年)。',
  'transcription': '事 件 发 生 的 时 代 通 常 被 称 为 欧 洲 史 的 中 世 纪 盛 时 即 的 11 12 和 13 世 纪 时 期 公 元 1000-1300 年',
  '_': '事 | 件 | 发 | 生 | 的 | 时 | 代 | 通 | 常 | 被 | 称 | 为 | 欧 | 洲 | 史 | 的 | 中 | 世 | 纪 | 盛 | 时 | 即 | 的 | 1 1 | 1 2 | 和 | 1 3 | 世 | 纪 | 时 | 期 | 公 | 元 | 1 0 0 0 - 1 3 0 0 | 年 |',
  'num_samples': 263360,
  'gender': 'MALE'},
 {'id': 1981,
  'file_name': '3722029313772877619.wav',
  'raw_transcription': '如果只是在乘船游览的情况下登岸,则不需要单独的签证(规定截至 2009 年)。',
  'transcription': '如 果 只 是 在 乘 船 游 览 的 情 况 下 登 岸 则 不 需 要 单 独 的 签 证 规 定 截 至 2009 年',
  '_': '如 | 果 | 只 | 是 | 在 | 乘 | 船 | 游 | 览 | 的 | 情 | 况 | 下 | 登 | 岸 | 则 | 不 | 需 | 要 | 单 | 独 | 的 | 签 | 证 | 规 | 定 | 截 | 至 | 2 0 0 9 | 年 |',
  'num_samples': 156480,
  'gender': 'MALE'},
 {'id': 1981,
  'file_name': '12427190293403162342.wav',
  'raw_transcription': '如果只是在乘船游览的情况下登岸,则不需要单独的签证(规定截至 2009 年)。',
  'transcription': '如 果 只 是 在 乘 船 游 览 的 情 况 下 登 岸 则 不 需 要 单 独 的 签 证 规 定 截 至 2009 年',
  '_': '如 | 果 | 只 | 是 | 在 | 乘 | 船 | 游 | 览 | 的 | 情 | 况 | 下 | 登 | 岸 | 则 | 不 | 需 | 要 | 单 | 独 | 的 | 签 | 证 | 规 | 定 | 截 | 至 | 2 0 0 9 | 年 |',
  'num_samples': 151680,
  'gender': 'MALE'},
 {'id': 1981,
  'file_name': '2389417466903205798.wav',
  'raw_transcription': '如果只是在乘船游览的情况下登岸,则不需要单独的签证(规定截至 2009 年)。',
  'transcription': '如 果 只 是 在 乘 船 游 览 的 情 况 下 登 岸 则 不 需 要 单 独 的 签 证 规 定 截 至 2009 年',
  '_': '如 | 果 | 只 | 是 | 在 | 乘 | 船 | 游 | 览 | 的 | 情 | 况 | 下 | 登 | 岸 | 则 | 不 | 需 | 要 | 单 | 独 | 的 | 签 | 证 | 规 | 定 | 截 | 至 | 2 0 0 9 | 年 |',
  'num_samples': 170880,
  'gender': 'MALE'},
 {'id': 1718,
  'file_name': '12348721204219299169.wav',
  'raw_transcription': '对于哪些加工物品是古董,没有统一的定义。一些税务机构将 100 年以上的物品定义为古董。',
  'transcription': '对 于 哪 些 加 工 物 品 是 古 董 没 有 统 一 的 定 义 一 些 税 务 机 构 将 100 年 以 上 的 物 品 定 义 为 古 董',
  '_': '对 | 于 | 哪 | 些 | 加 | 工 | 物 | 品 | 是 | 古 | 董 | 没 | 有 | 统 | 一 | 的 | 定 | 义 | 一 | 些 | 税 | 务 | 机 | 构 | 将 | 1 0 0 | 年 | 以 | 上 | 的 | 物 | 品 | 定 | 义 | 为 | 古 | 董 |',
  'num_samples': 270720,
  'gender': 'MALE'},
 {'id': 1979,
  'file_name': '5239108803333345497.wav',
  'raw_transcription': '福克兰群岛的官方货币是福克兰英镑,与英镑等值。',
  'transcription': '福 克 兰 群 岛 的 官 方 货 币 是 福 克 兰 英 镑 与 英 镑 等 值',
  '_': '福 | 克 | 兰 | 群 | 岛 | 的 | 官 | 方 | 货 | 币 | 是 | 福 | 克 | 兰 | 英 | 镑 | 与 | 英 | 镑 | 等 | 值 |',
  'num_samples': 189760,
  'gender': 'MALE'},
 {'id': 1979,
  'file_name': '5088084912998887179.wav',
  'raw_transcription': '福克兰群岛的官方货币是福克兰英镑,与英镑等值。',
  'transcription': '福 克 兰 群 岛 的 官 方 货 币 是 福 克 兰 英 镑 与 英 镑 等 值',
  '_': '福 | 克 | 兰 | 群 | 岛 | 的 | 官 | 方 | 货 | 币 | 是 | 福 | 克 | 兰 | 英 | 镑 | 与 | 英 | 镑 | 等 | 值 |',
  'num_samples': 128640,
  'gender': 'MALE'},
 {'id': 1979,
  'file_name': '12272163317939093480.wav',
  'raw_transcription': '福克兰群岛的官方货币是福克兰英镑,与英镑等值。',
  'transcription': '福 克 兰 群 岛 的 官 方 货 币 是 福 克 兰 英 镑 与 英 镑 等 值',
  '_': '福 | 克 | 兰 | 群 | 岛 | 的 | 官 | 方 | 货 | 币 | 是 | 福 | 克 | 兰 | 英 | 镑 | 与 | 英 | 镑 | 等 | 值 |',
  'num_samples': 100800,
  'gender': 'MALE'},
 {'id': 1984,
  'file_name': '15082002473154370494.wav',
  'raw_transcription': '大众汽车保有量较高还会导致更高的道路交通事故发生率,而这将推动发明用于修复伤者伤处的全新医疗技术。',
  'transcription': '大 众 汽 车 保 有 量 较 高 还 会 导 致 更 高 的 道 路 交 通 事 故 发 生 率 而 这 将 推 动 发 明 用 于 修 复 伤 者 伤 处 的 全 新 医 疗 技 术',
  '_': '大 | 众 | 汽 | 车 | 保 | 有 | 量 | 较 | 高 | 还 | 会 | 导 | 致 | 更 | 高 | 的 | 道 | 路 | 交 | 通 | 事 | 故 | 发 | 生 | 率 | 而 | 这 | 将 | 推 | 动 | 发 | 明 | 用 | 于 | 修 | 复 | 伤 | 者 | 伤 | 处 | 的 | 全 | 新 | 医 | 疗 | 技 | 术 |',
  'num_samples': 303040,
  'gender': 'MALE'},
 {'id': 1984,
  'file_name': '4967253694636036508.wav',
  'raw_transcription': '大众汽车保有量较高还会导致更高的道路交通事故发生率,而这将推动发明用于修复伤者伤处的全新医疗技术。',
  'transcription': '大 众 汽 车 保 有 量 较 高 还 会 导 致 更 高 的 道 路 交 通 事 故 发 生 率 而 这 将 推 动 发 明 用 于 修 复 伤 者 伤 处 的 全 新 医 疗 技 术',
  '_': '大 | 众 | 汽 | 车 | 保 | 有 | 量 | 较 | 高 | 还 | 会 | 导 | 致 | 更 | 高 | 的 | 道 | 路 | 交 | 通 | 事 | 故 | 发 | 生 | 率 | 而 | 这 | 将 | 推 | 动 | 发 | 明 | 用 | 于 | 修 | 复 | 伤 | 者 | 伤 | 处 | 的 | 全 | 新 | 医 | 疗 | 技 | 术 |',
  'num_samples': 268480,
  'gender': 'MALE'},
 {'id': 1803,
  'file_name': '1334091141758145055.wav',
  'raw_transcription': '你手上的水分会与外层发生反应,这样会形成一层类似外壳的东西,感觉十分有趣。',
  'transcription': '你 手 上 的 水 分 会 与 外 层 发 生 反 应 这 样 会 形 成 一 层 类 似 外 壳 的 东 西 感 觉 十 分 有 趣',
  '_': '你 | 手 | 上 | 的 | 水 | 分 | 会 | 与 | 外 | 层 | 发 | 生 | 反 | 应 | 这 | 样 | 会 | 形 | 成 | 一 | 层 | 类 | 似 | 外 | 壳 | 的 | 东 | 西 | 感 | 觉 | 十 | 分 | 有 | 趣 |',
  'num_samples': 162560,
  'gender': 'MALE'},
 {'id': 1803,
  'file_name': '12220327484257658904.wav',
  'raw_transcription': '你手上的水分会与外层发生反应,这样会形成一层类似外壳的东西,感觉十分有趣。',
  'transcription': '你 手 上 的 水 分 会 与 外 层 发 生 反 应 这 样 会 形 成 一 层 类 似 外 壳 的 东 西 感 觉 十 分 有 趣',
  '_': '你 | 手 | 上 | 的 | 水 | 分 | 会 | 与 | 外 | 层 | 发 | 生 | 反 | 应 | 这 | 样 | 会 | 形 | 成 | 一 | 层 | 类 | 似 | 外 | 壳 | 的 | 东 | 西 | 感 | 觉 | 十 | 分 | 有 | 趣 |',
  'num_samples': 146880,
  'gender': 'FEMALE'},
 {'id': 1803,
  'file_name': '346819022408772303.wav',
  'raw_transcription': '你手上的水分会与外层发生反应,这样会形成一层类似外壳的东西,感觉十分有趣。',
  'transcription': '你 手 上 的 水 分 会 与 外 层 发 生 反 应 这 样 会 形 成 一 层 类 似 外 壳 的 东 西 感 觉 十 分 有 趣',
  '_': '你 | 手 | 上 | 的 | 水 | 分 | 会 | 与 | 外 | 层 | 发 | 生 | 反 | 应 | 这 | 样 | 会 | 形 | 成 | 一 | 层 | 类 | 似 | 外 | 壳 | 的 | 东 | 西 | 感 | 觉 | 十 | 分 | 有 | 趣 |',
  'num_samples': 229440,
  'gender': 'MALE'},
 {'id': 1706,
  'file_name': '6734771787706346180.wav',
  'raw_transcription': '更传统的教堂常常在复活节周末的周六晚上举行复活节守夜活动,会众通常在午夜钟声敲响之时涌入庆典,庆祝基督的复活。',
  'transcription': '更 传 统 的 教 堂 常 常 在 复 活 节 周 末 的 周 六 晚 上 举 行 复 活 节 守 夜 活 动 会 众 通 常 在 午 夜 钟 声 敲 响 之 时 涌 入 庆 典 庆 祝 基 督 的 复 活',
  '_': '更 | 传 | 统 | 的 | 教 | 堂 | 常 | 常 | 在 | 复 | 活 | 节 | 周 | 末 | 的 | 周 | 六 | 晚 | 上 | 举 | 行 | 复 | 活 | 节 | 守 | 夜 | 活 | 动 | 会 | 众 | 通 | 常 | 在 | 午 | 夜 | 钟 | 声 | 敲 | 响 | 之 | 时 | 涌 | 入 | 庆 | 典 | 庆 | 祝 | 基 | 督 | 的 | 复 | 活 |',
  'num_samples': 240000,
  'gender': 'MALE'},
 {'id': 1706,
  'file_name': '12746401563499459395.wav',
  'raw_transcription': '更传统的教堂常常在复活节周末的周六晚上举行复活节守夜活动,会众通常在午夜钟声敲响之时涌入庆典,庆祝基督的复活。',
  'transcription': '更 传 统 的 教 堂 常 常 在 复 活 节 周 末 的 周 六 晚 上 举 行 复 活 节 守 夜 活 动 会 众 通 常 在 午 夜 钟 声 敲 响 之 时 涌 入 庆 典 庆 祝 基 督 的 复 活',
  '_': '更 | 传 | 统 | 的 | 教 | 堂 | 常 | 常 | 在 | 复 | 活 | 节 | 周 | 末 | 的 | 周 | 六 | 晚 | 上 | 举 | 行 | 复 | 活 | 节 | 守 | 夜 | 活 | 动 | 会 | 众 | 通 | 常 | 在 | 午 | 夜 | 钟 | 声 | 敲 | 响 | 之 | 时 | 涌 | 入 | 庆 | 典 | 庆 | 祝 | 基 | 督 | 的 | 复 | 活 |',
  'num_samples': 188160,
  'gender': 'FEMALE'},
 {'id': 1706,
  'file_name': '12747982423047432241.wav',
  'raw_transcription': '更传统的教堂常常在复活节周末的周六晚上举行复活节守夜活动,会众通常在午夜钟声敲响之时涌入庆典,庆祝基督的复活。',
  'transcription': '更 传 统 的 教 堂 常 常 在 复 活 节 周 末 的 周 六 晚 上 举 行 复 活 节 守 夜 活 动 会 众 通 常 在 午 夜 钟 声 敲 响 之 时 涌 入 庆 典 庆 祝 基 督 的 复 活',
  '_': '更 | 传 | 统 | 的 | 教 | 堂 | 常 | 常 | 在 | 复 | 活 | 节 | 周 | 末 | 的 | 周 | 六 | 晚 | 上 | 举 | 行 | 复 | 活 | 节 | 守 | 夜 | 活 | 动 | 会 | 众 | 通 | 常 | 在 | 午 | 夜 | 钟 | 声 | 敲 | 响 | 之 | 时 | 涌 | 入 | 庆 | 典 | 庆 | 祝 | 基 | 督 | 的 | 复 | 活 |',
  'num_samples': 335040,
  'gender': 'MALE'},
 {'id': 1842,
  'file_name': '17461359558156586401.wav',
  'raw_transcription': '恐龙的羽毛并没有发育良好的主干——这称为“羽轴”,但还是有羽毛的其他特征,比如羽枝和羽小枝,研究人员推断羽轴的进化可能比这些其他特征晚。',
  'transcription': '恐 龙 的 羽 毛 并 没 有 发 育 良 好 的 主 干 这 称 为 羽 轴 但 还 是 有 羽 毛 的 其 他 特 征 比 如 羽 枝 和 羽 小 枝 研 究 人 员 推 断 羽 轴 的 进 化 可 能 比 这 些 其 他 特 征 晚',
  '_': '恐 | 龙 | 的 | 羽 | 毛 | 并 | 没 | 有 | 发 | 育 | 良 | 好 | 的 | 主 | 干 | 这 | 称 | 为 | 羽 | 轴 | 但 | 还 | 是 | 有 | 羽 | 毛 | 的 | 其 | 他 | 特 | 征 | 比 | 如 | 羽 | 枝 | 和 | 羽 | 小 | 枝 | 研 | 究 | 人 | 员 | 推 | 断 | 羽 | 轴 | 的 | 进 | 化 | 可 | 能 | 比 | 这 | 些 | 其 | 他 | 特 | 征 | 晚 |',
  'num_samples': 360000,
  'gender': 'MALE'},
 {'id': 1842,
  'file_name': '5334802337115215703.wav',
  'raw_transcription': '恐龙的羽毛并没有发育良好的主干——这称为“羽轴”,但还是有羽毛的其他特征,比如羽枝和羽小枝,研究人员推断羽轴的进化可能比这些其他特征晚。',
  'transcription': '恐 龙 的 羽 毛 并 没 有 发 育 良 好 的 主 干 这 称 为 羽 轴 但 还 是 有 羽 毛 的 其 他 特 征 比 如 羽 枝 和 羽 小 枝 研 究 人 员 推 断 羽 轴 的 进 化 可 能 比 这 些 其 他 特 征 晚',
  '_': '恐 | 龙 | 的 | 羽 | 毛 | 并 | 没 | 有 | 发 | 育 | 良 | 好 | 的 | 主 | 干 | 这 | 称 | 为 | 羽 | 轴 | 但 | 还 | 是 | 有 | 羽 | 毛 | 的 | 其 | 他 | 特 | 征 | 比 | 如 | 羽 | 枝 | 和 | 羽 | 小 | 枝 | 研 | 究 | 人 | 员 | 推 | 断 | 羽 | 轴 | 的 | 进 | 化 | 可 | 能 | 比 | 这 | 些 | 其 | 他 | 特 | 征 | 晚 |',
  'num_samples': 306880,
  'gender': 'MALE'},
 {'id': 1842,
  'file_name': '17772749203583097540.wav',
  'raw_transcription': '恐龙的羽毛并没有发育良好的主干——这称为“羽轴”,但还是有羽毛的其他特征,比如羽枝和羽小枝,研究人员推断羽轴的进化可能比这些其他特征晚。',
  'transcription': '恐 龙 的 羽 毛 并 没 有 发 育 良 好 的 主 干 这 称 为 羽 轴 但 还 是 有 羽 毛 的 其 他 特 征 比 如 羽 枝 和 羽 小 枝 研 究 人 员 推 断 羽 轴 的 进 化 可 能 比 这 些 其 他 特 征 晚',
  '_': '恐 | 龙 | 的 | 羽 | 毛 | 并 | 没 | 有 | 发 | 育 | 良 | 好 | 的 | 主 | 干 | 这 | 称 | 为 | 羽 | 轴 | 但 | 还 | 是 | 有 | 羽 | 毛 | 的 | 其 | 他 | 特 | 征 | 比 | 如 | 羽 | 枝 | 和 | 羽 | 小 | 枝 | 研 | 究 | 人 | 员 | 推 | 断 | 羽 | 轴 | 的 | 进 | 化 | 可 | 能 | 比 | 这 | 些 | 其 | 他 | 特 | 征 | 晚 |',
  'num_samples': 239040,
  'gender': 'MALE'},
 {'id': 1809,
  'file_name': '17739918928868205471.wav',
  'raw_transcription': '很早的时候就引进了轨枕,用于固定铁轨。但是,人们逐渐意识到,如果在铁轨上放上铁片,铁轨会更稳固有效。',
  'transcription': '很 早 的 时 候 就 引 进 了 轨 枕 用 于 固 定 铁 轨 但 是 人 们 逐 渐 意 识 到 如 果 在 铁 轨 上 放 上 铁 片 铁 轨 会 更 稳 固 有 效',
  '_': '很 | 早 | 的 | 时 | 候 | 就 | 引 | 进 | 了 | 轨 | 枕 | 用 | 于 | 固 | 定 | 铁 | 轨 | 但 | 是 | 人 | 们 | 逐 | 渐 | 意 | 识 | 到 | 如 | 果 | 在 | 铁 | 轨 | 上 | 放 | 上 | 铁 | 片 | 铁 | 轨 | 会 | 更 | 稳 | 固 | 有 | 效 |',
  'num_samples': 216000,
  'gender': 'MALE'},
 {'id': 1809,
  'file_name': '12330101513684259648.wav',
  'raw_transcription': '很早的时候就引进了轨枕,用于固定铁轨。但是,人们逐渐意识到,如果在铁轨上放上铁片,铁轨会更稳固有效。',
  'transcription': '很 早 的 时 候 就 引 进 了 轨 枕 用 于 固 定 铁 轨 但 是 人 们 逐 渐 意 识 到 如 果 在 铁 轨 上 放 上 铁 片 铁 轨 会 更 稳 固 有 效',
  '_': '很 | 早 | 的 | 时 | 候 | 就 | 引 | 进 | 了 | 轨 | 枕 | 用 | 于 | 固 | 定 | 铁 | 轨 | 但 | 是 | 人 | 们 | 逐 | 渐 | 意 | 识 | 到 | 如 | 果 | 在 | 铁 | 轨 | 上 | 放 | 上 | 铁 | 片 | 铁 | 轨 | 会 | 更 | 稳 | 固 | 有 | 效 |',
  'num_samples': 231360,
  'gender': 'MALE'},
 {'id': 1809,
  'file_name': '18218447786558162830.wav',
  'raw_transcription': '很早的时候就引进了轨枕,用于固定铁轨。但是,人们逐渐意识到,如果在铁轨上放上铁片,铁轨会更稳固有效。',
  'transcription': '很 早 的 时 候 就 引 进 了 轨 枕 用 于 固 定 铁 轨 但 是 人 们 逐 渐 意 识 到 如 果 在 铁 轨 上 放 上 铁 片 铁 轨 会 更 稳 固 有 效',
  '_': '很 | 早 | 的 | 时 | 候 | 就 | 引 | 进 | 了 | 轨 | 枕 | 用 | 于 | 固 | 定 | 铁 | 轨 | 但 | 是 | 人 | 们 | 逐 | 渐 | 意 | 识 | 到 | 如 | 果 | 在 | 铁 | 轨 | 上 | 放 | 上 | 铁 | 片 | 铁 | 轨 | 会 | 更 | 稳 | 固 | 有 | 效 |',
  'num_samples': 185280,
  'gender': 'MALE'},
 {'id': 1721,
  'file_name': '4335255171682344640.wav',
  'raw_transcription': '1963 年大坝建成后,季节性洪水被控制住了,沉积物不再冲散到河流里。',
  'transcription': '1963 年 大 坝 建 成 后 季 节 性 洪 水 被 控 制 住 了 沉 积 物 不 再 冲 散 到 河 流 里',
  '_': '1 9 6 3 | 年 | 大 | 坝 | 建 | 成 | 后 | 季 | 节 | 性 | 洪 | 水 | 被 | 控 | 制 | 住 | 了 | 沉 | 积 | 物 | 不 | 再 | 冲 | 散 | 到 | 河 | 流 | 里 |',
  'num_samples': 222080,
  'gender': 'MALE'},
 {'id': 1721,
  'file_name': '10081186303620187437.wav',
  'raw_transcription': '1963 年大坝建成后,季节性洪水被控制住了,沉积物不再冲散到河流里。',
  'transcription': '1963 年 大 坝 建 成 后 季 节 性 洪 水 被 控 制 住 了 沉 积 物 不 再 冲 散 到 河 流 里',
  '_': '1 9 6 3 | 年 | 大 | 坝 | 建 | 成 | 后 | 季 | 节 | 性 | 洪 | 水 | 被 | 控 | 制 | 住 | 了 | 沉 | 积 | 物 | 不 | 再 | 冲 | 散 | 到 | 河 | 流 | 里 |',
  'num_samples': 242880,
  'gender': 'MALE'},
 {'id': 1721,
  'file_name': '1095027899793949587.wav',
  'raw_transcription': '1963 年大坝建成后,季节性洪水被控制住了,沉积物不再冲散到河流里。',
  'transcription': '1963 年 大 坝 建 成 后 季 节 性 洪 水 被 控 制 住 了 沉 积 物 不 再 冲 散 到 河 流 里',
  '_': '1 9 6 3 | 年 | 大 | 坝 | 建 | 成 | 后 | 季 | 节 | 性 | 洪 | 水 | 被 | 控 | 制 | 住 | 了 | 沉 | 积 | 物 | 不 | 再 | 冲 | 散 | 到 | 河 | 流 | 里 |',
  'num_samples': 222400,
  'gender': 'MALE'},
 {'id': 1676,
  'file_name': '17609781541012569203.wav',
  'raw_transcription': '与所有南非国家公园一样,该公园每天都收取养护费和门票费。',
  'transcription': '与 所 有 南 非 国 家 公 园 一 样 该 公 园 每 天 都 收 取 养 护 费 和 门 票 费',
  '_': '与 | 所 | 有 | 南 | 非 | 国 | 家 | 公 | 园 | 一 | 样 | 该 | 公 | 园 | 每 | 天 | 都 | 收 | 取 | 养 | 护 | 费 | 和 | 门 | 票 | 费 |',
  'num_samples': 123840,
  'gender': 'MALE'},
 {'id': 1676,
  'file_name': '1153780427490892865.wav',
  'raw_transcription': '与所有南非国家公园一样,该公园每天都收取养护费和门票费。',
  'transcription': '与 所 有 南 非 国 家 公 园 一 样 该 公 园 每 天 都 收 取 养 护 费 和 门 票 费',
  '_': '与 | 所 | 有 | 南 | 非 | 国 | 家 | 公 | 园 | 一 | 样 | 该 | 公 | 园 | 每 | 天 | 都 | 收 | 取 | 养 | 护 | 费 | 和 | 门 | 票 | 费 |',
  'num_samples': 146880,
  'gender': 'MALE'},
 {'id': 1676,
  'file_name': '15107390982774255593.wav',
  'raw_transcription': '与所有南非国家公园一样,该公园每天都收取养护费和门票费。',
  'transcription': '与 所 有 南 非 国 家 公 园 一 样 该 公 园 每 天 都 收 取 养 护 费 和 门 票 费',
  '_': '与 | 所 | 有 | 南 | 非 | 国 | 家 | 公 | 园 | 一 | 样 | 该 | 公 | 园 | 每 | 天 | 都 | 收 | 取 | 养 | 护 | 费 | 和 | 门 | 票 | 费 |',
  'num_samples': 228160,
  'gender': 'MALE'},
 {'id': 1941,
  'file_name': '13880617213008288001.wav',
  'raw_transcription': '这些夫妇可能会为他们的孩子制定收养计划。',
  'transcription': '这 些 夫 妇 可 能 会 为 他 们 的 孩 子 制 定 收 养 计 划',
  '_': '这 | 些 | 夫 | 妇 | 可 | 能 | 会 | 为 | 他 | 们 | 的 | 孩 | 子 | 制 | 定 | 收 | 养 | 计 | 划 |',
  'num_samples': 171520,
  'gender': 'MALE'},
 {'id': 1941,
  'file_name': '8549674254350790989.wav',
  'raw_transcription': '这些夫妇可能会为他们的孩子制定收养计划。',
  'transcription': '这 些 夫 妇 可 能 会 为 他 们 的 孩 子 制 定 收 养 计 划',
  '_': '这 | 些 | 夫 | 妇 | 可 | 能 | 会 | 为 | 他 | 们 | 的 | 孩 | 子 | 制 | 定 | 收 | 养 | 计 | 划 |',
  'num_samples': 105600,
  'gender': 'MALE'},
 {'id': 1941,
  'file_name': '3985004303504002085.wav',
  'raw_transcription': '这些夫妇可能会为他们的孩子制定收养计划。',
  'transcription': '这 些 夫 妇 可 能 会 为 他 们 的 孩 子 制 定 收 养 计 划',
  '_': '这 | 些 | 夫 | 妇 | 可 | 能 | 会 | 为 | 他 | 们 | 的 | 孩 | 子 | 制 | 定 | 收 | 养 | 计 | 划 |',
  'num_samples': 95040,
  'gender': 'MALE'},
 {'id': 1691,
  'file_name': '1212046656299271869.wav',
  'raw_transcription': '在某些航线上,大型公司有自己的飞机,但对于其他航线和小公司来说,就有问题了。',
  'transcription': '在 某 些 航 线 上 大 型 公 司 有 自 己 的 飞 机 但 对 于 其 他 航 线 和 小 公 司 来 说 就 有 问 题 了',
  '_': '在 | 某 | 些 | 航 | 线 | 上 | 大 | 型 | 公 | 司 | 有 | 自 | 己 | 的 | 飞 | 机 | 但 | 对 | 于 | 其 | 他 | 航 | 线 | 和 | 小 | 公 | 司 | 来 | 说 | 就 | 有 | 问 | 题 | 了 |',
  'num_samples': 229120,
  'gender': 'MALE'},
 {'id': 1691,
  'file_name': '2656489353936136335.wav',
  'raw_transcription': '在某些航线上,大型公司有自己的飞机,但对于其他航线和小公司来说,就有问题了。',
  'transcription': '在 某 些 航 线 上 大 型 公 司 有 自 己 的 飞 机 但 对 于 其 他 航 线 和 小 公 司 来 说 就 有 问 题 了',
  '_': '在 | 某 | 些 | 航 | 线 | 上 | 大 | 型 | 公 | 司 | 有 | 自 | 己 | 的 | 飞 | 机 | 但 | 对 | 于 | 其 | 他 | 航 | 线 | 和 | 小 | 公 | 司 | 来 | 说 | 就 | 有 | 问 | 题 | 了 |',
  'num_samples': 134400,
  'gender': 'MALE'},
 {'id': 1691,
  'file_name': '10970596972697016742.wav',
  'raw_transcription': '在某些航线上,大型公司有自己的飞机,但对于其他航线和小公司来说,就有问题了。',
  'transcription': '在 某 些 航 线 上 大 型 公 司 有 自 己 的 飞 机 但 对 于 其 他 航 线 和 小 公 司 来 说 就 有 问 题 了',
  '_': '在 | 某 | 些 | 航 | 线 | 上 | 大 | 型 | 公 | 司 | 有 | 自 | 己 | 的 | 飞 | 机 | 但 | 对 | 于 | 其 | 他 | 航 | 线 | 和 | 小 | 公 | 司 | 来 | 说 | 就 | 有 | 问 | 题 | 了 |',
  'num_samples': 110400,
  'gender': 'FEMALE'},
 {'id': 1999,
  'file_name': '14665455542148263931.wav',
  'raw_transcription': '20 世纪 60 年代,布热津斯基先是为约翰·福特·肯尼迪效力,担任他的顾问,后来又为林登·贝恩斯·约翰逊政府工作。',
  'transcription': '20 世 纪 60 年 代 布 热 津 斯 基 先 是 为 约 翰 福 特 肯 尼 迪 效 力 担 任 他 的 顾 问 后 来 又 为 林 登 贝 恩 斯 约 翰 逊 政 府 工 作',
  '_': '2 0 | 世 | 纪 | 6 0 | 年 | 代 | 布 | 热 | 津 | 斯 | 基 | 先 | 是 | 为 | 约 | 翰 | 福 | 特 | 肯 | 尼 | 迪 | 效 | 力 | 担 | 任 | 他 | 的 | 顾 | 问 | 后 | 来 | 又 | 为 | 林 | 登 | 贝 | 恩 | 斯 | 约 | 翰 | 逊 | 政 | 府 | 工 | 作 |',
  'num_samples': 230400,
  'gender': 'MALE'},
 {'id': 1999,
  'file_name': '5779838812442101259.wav',
  'raw_transcription': '20 世纪 60 年代,布热津斯基先是为约翰·福特·肯尼迪效力,担任他的顾问,后来又为林登·贝恩斯·约翰逊政府工作。',
  'transcription': '20 世 纪 60 年 代 布 热 津 斯 基 先 是 为 约 翰 福 特 肯 尼 迪 效 力 担 任 他 的 顾 问 后 来 又 为 林 登 贝 恩 斯 约 翰 逊 政 府 工 作',
  '_': '2 0 | 世 | 纪 | 6 0 | 年 | 代 | 布 | 热 | 津 | 斯 | 基 | 先 | 是 | 为 | 约 | 翰 | 福 | 特 | 肯 | 尼 | 迪 | 效 | 力 | 担 | 任 | 他 | 的 | 顾 | 问 | 后 | 来 | 又 | 为 | 林 | 登 | 贝 | 恩 | 斯 | 约 | 翰 | 逊 | 政 | 府 | 工 | 作 |',
  'num_samples': 243840,
  'gender': 'MALE'},
 {'id': 1999,
  'file_name': '11912853219079674937.wav',
  'raw_transcription': '20 世纪 60 年代,布热津斯基先是为约翰·福特·肯尼迪效力,担任他的顾问,后来又为林登·贝恩斯·约翰逊政府工作。',
  'transcription': '20 世 纪 60 年 代 布 热 津 斯 基 先 是 为 约 翰 福 特 肯 尼 迪 效 力 担 任 他 的 顾 问 后 来 又 为 林 登 贝 恩 斯 约 翰 逊 政 府 工 作',
  '_': '2 0 | 世 | 纪 | 6 0 | 年 | 代 | 布 | 热 | 津 | 斯 | 基 | 先 | 是 | 为 | 约 | 翰 | 福 | 特 | 肯 | 尼 | 迪 | 效 | 力 | 担 | 任 | 他 | 的 | 顾 | 问 | 后 | 来 | 又 | 为 | 林 | 登 | 贝 | 恩 | 斯 | 约 | 翰 | 逊 | 政 | 府 | 工 | 作 |',
  'num_samples': 223680,
  'gender': 'FEMALE'},
 {'id': 1926,
  'file_name': '17603482970487299598.wav',
  'raw_transcription': '亚里士多德就所有科学领域的问题(包括心理学在内)所发表的观点都被一一接纳。',
  'transcription': '亚 里 士 多 德 就 所 有 科 学 领 域 的 问 题 包 括 心 理 学 在 内 所 发 表 的 观 点 都 被 一 一 接 纳',
  '_': '亚 | 里 | 士 | 多 | 德 | 就 | 所 | 有 | 科 | 学 | 领 | 域 | 的 | 问 | 题 | 包 | 括 | 心 | 理 | 学 | 在 | 内 | 所 | 发 | 表 | 的 | 观 | 点 | 都 | 被 | 一 | 一 | 接 | 纳 |',
  'num_samples': 156480,
  'gender': 'MALE'},
 {'id': 1926,
  'file_name': '12726738680656370676.wav',
  'raw_transcription': '亚里士多德就所有科学领域的问题(包括心理学在内)所发表的观点都被一一接纳。',
  'transcription': '亚 里 士 多 德 就 所 有 科 学 领 域 的 问 题 包 括 心 理 学 在 内 所 发 表 的 观 点 都 被 一 一 接 纳',
  '_': '亚 | 里 | 士 | 多 | 德 | 就 | 所 | 有 | 科 | 学 | 领 | 域 | 的 | 问 | 题 | 包 | 括 | 心 | 理 | 学 | 在 | 内 | 所 | 发 | 表 | 的 | 观 | 点 | 都 | 被 | 一 | 一 | 接 | 纳 |',
  'num_samples': 164160,
  'gender': 'MALE'},
 {'id': 1926,
  'file_name': '7604155064174114277.wav',
  'raw_transcription': '亚里士多德就所有科学领域的问题(包括心理学在内)所发表的观点都被一一接纳。',
  'transcription': '亚 里 士 多 德 就 所 有 科 学 领 域 的 问 题 包 括 心 理 学 在 内 所 发 表 的 观 点 都 被 一 一 接 纳',
  '_': '亚 | 里 | 士 | 多 | 德 | 就 | 所 | 有 | 科 | 学 | 领 | 域 | 的 | 问 | 题 | 包 | 括 | 心 | 理 | 学 | 在 | 内 | 所 | 发 | 表 | 的 | 观 | 点 | 都 | 被 | 一 | 一 | 接 | 纳 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1834,
  'file_name': '15865022142316213145.wav',
  'raw_transcription': '也可以到北部参观法蒂玛圣母院(圣地),它是举世闻名的圣母玛丽亚显现之地。',
  'transcription': '也 可 以 到 北 部 参 观 法 蒂 玛 圣 母 院 圣 地 它 是 举 世 闻 名 的 圣 母 玛 丽 亚 显 现 之 地',
  '_': '也 | 可 | 以 | 到 | 北 | 部 | 参 | 观 | 法 | 蒂 | 玛 | 圣 | 母 | 院 | 圣 | 地 | 它 | 是 | 举 | 世 | 闻 | 名 | 的 | 圣 | 母 | 玛 | 丽 | 亚 | 显 | 现 | 之 | 地 |',
  'num_samples': 136320,
  'gender': 'FEMALE'},
 {'id': 1834,
  'file_name': '13932390160398222158.wav',
  'raw_transcription': '也可以到北部参观法蒂玛圣母院(圣地),它是举世闻名的圣母玛丽亚显现之地。',
  'transcription': '也 可 以 到 北 部 参 观 法 蒂 玛 圣 母 院 圣 地 它 是 举 世 闻 名 的 圣 母 玛 丽 亚 显 现 之 地',
  '_': '也 | 可 | 以 | 到 | 北 | 部 | 参 | 观 | 法 | 蒂 | 玛 | 圣 | 母 | 院 | 圣 | 地 | 它 | 是 | 举 | 世 | 闻 | 名 | 的 | 圣 | 母 | 玛 | 丽 | 亚 | 显 | 现 | 之 | 地 |',
  'num_samples': 176640,
  'gender': 'MALE'},
 {'id': 1834,
  'file_name': '10949290146151676233.wav',
  'raw_transcription': '也可以到北部参观法蒂玛圣母院(圣地),它是举世闻名的圣母玛丽亚显现之地。',
  'transcription': '也 可 以 到 北 部 参 观 法 蒂 玛 圣 母 院 圣 地 它 是 举 世 闻 名 的 圣 母 玛 丽 亚 显 现 之 地',
  '_': '也 | 可 | 以 | 到 | 北 | 部 | 参 | 观 | 法 | 蒂 | 玛 | 圣 | 母 | 院 | 圣 | 地 | 它 | 是 | 举 | 世 | 闻 | 名 | 的 | 圣 | 母 | 玛 | 丽 | 亚 | 显 | 现 | 之 | 地 |',
  'num_samples': 273280,
  'gender': 'MALE'},
 {'id': 1703,
  'file_name': '11231516927974266547.wav',
  'raw_transcription': '昨天,马尔泰利在由 9 名成员组成的新临时选举委员会 (CEP)中宣誓就职。',
  'transcription': '昨 天 马 尔 泰 利 在 由 9 名 成 员 组 成 的 新 临 时 选 举 委 员 会 cep 中 宣 誓 就 职',
  '_': '昨 | 天 | 马 | 尔 | 泰 | 利 | 在 | 由 | 9 | 名 | 成 | 员 | 组 | 成 | 的 | 新 | 临 | 时 | 选 | 举 | 委 | 员 | 会 | c e p | 中 | 宣 | 誓 | 就 | 职 |',
  'num_samples': 149760,
  'gender': 'MALE'},
 {'id': 1703,
  'file_name': '18120266869857192615.wav',
  'raw_transcription': '昨天,马尔泰利在由 9 名成员组成的新临时选举委员会 (CEP)中宣誓就职。',
  'transcription': '昨 天 马 尔 泰 利 在 由 9 名 成 员 组 成 的 新 临 时 选 举 委 员 会 cep 中 宣 誓 就 职',
  '_': '昨 | 天 | 马 | 尔 | 泰 | 利 | 在 | 由 | 9 | 名 | 成 | 员 | 组 | 成 | 的 | 新 | 临 | 时 | 选 | 举 | 委 | 员 | 会 | c e p | 中 | 宣 | 誓 | 就 | 职 |',
  'num_samples': 120000,
  'gender': 'FEMALE'},
 {'id': 1703,
  'file_name': '11648347515236347419.wav',
  'raw_transcription': '昨天,马尔泰利在由 9 名成员组成的新临时选举委员会 (CEP)中宣誓就职。',
  'transcription': '昨 天 马 尔 泰 利 在 由 9 名 成 员 组 成 的 新 临 时 选 举 委 员 会 cep 中 宣 誓 就 职',
  '_': '昨 | 天 | 马 | 尔 | 泰 | 利 | 在 | 由 | 9 | 名 | 成 | 员 | 组 | 成 | 的 | 新 | 临 | 时 | 选 | 举 | 委 | 员 | 会 | c e p | 中 | 宣 | 誓 | 就 | 职 |',
  'num_samples': 176640,
  'gender': 'MALE'},
 {'id': 1845,
  'file_name': '12928761791999826724.wav',
  'raw_transcription': '他们乘坐马车回到了巴黎,一群人包围了他们,大喊大叫地威胁国王和王后。',
  'transcription': '他 们 乘 坐 马 车 回 到 了 巴 黎 一 群 人 包 围 了 他 们 大 喊 大 叫 地 威 胁 国 王 和 王 后',
  '_': '他 | 们 | 乘 | 坐 | 马 | 车 | 回 | 到 | 了 | 巴 | 黎 | 一 | 群 | 人 | 包 | 围 | 了 | 他 | 们 | 大 | 喊 | 大 | 叫 | 地 | 威 | 胁 | 国 | 王 | 和 | 王 | 后 |',
  'num_samples': 152640,
  'gender': 'MALE'},
 {'id': 1845,
  'file_name': '7714251606181332870.wav',
  'raw_transcription': '他们乘坐马车回到了巴黎,一群人包围了他们,大喊大叫地威胁国王和王后。',
  'transcription': '他 们 乘 坐 马 车 回 到 了 巴 黎 一 群 人 包 围 了 他 们 大 喊 大 叫 地 威 胁 国 王 和 王 后',
  '_': '他 | 们 | 乘 | 坐 | 马 | 车 | 回 | 到 | 了 | 巴 | 黎 | 一 | 群 | 人 | 包 | 围 | 了 | 他 | 们 | 大 | 喊 | 大 | 叫 | 地 | 威 | 胁 | 国 | 王 | 和 | 王 | 后 |',
  'num_samples': 190720,
  'gender': 'MALE'},
 {'id': 1845,
  'file_name': '15581074809689556591.wav',
  'raw_transcription': '他们乘坐马车回到了巴黎,一群人包围了他们,大喊大叫地威胁国王和王后。',
  'transcription': '他 们 乘 坐 马 车 回 到 了 巴 黎 一 群 人 包 围 了 他 们 大 喊 大 叫 地 威 胁 国 王 和 王 后',
  '_': '他 | 们 | 乘 | 坐 | 马 | 车 | 回 | 到 | 了 | 巴 | 黎 | 一 | 群 | 人 | 包 | 围 | 了 | 他 | 们 | 大 | 喊 | 大 | 叫 | 地 | 威 | 胁 | 国 | 王 | 和 | 王 | 后 |',
  'num_samples': 113280,
  'gender': 'FEMALE'},
 {'id': 2004,
  'file_name': '6881171516424879297.wav',
  'raw_transcription': '同一个月,又有一架客机冲出马什哈德的跑道,撞上一堵墙,造成 17 人死亡。',
  'transcription': '同 一 个 月 又 有 一 架 客 机 冲 出 马 什 哈 德 的 跑 道 撞 上 一 堵 墙 造 成 17 人 死 亡',
  '_': '同 | 一 | 个 | 月 | 又 | 有 | 一 | 架 | 客 | 机 | 冲 | 出 | 马 | 什 | 哈 | 德 | 的 | 跑 | 道 | 撞 | 上 | 一 | 堵 | 墙 | 造 | 成 | 1 7 | 人 | 死 | 亡 |',
  'num_samples': 138240,
  'gender': 'FEMALE'},
 {'id': 2004,
  'file_name': '3267220554427715405.wav',
  'raw_transcription': '同一个月,又有一架客机冲出马什哈德的跑道,撞上一堵墙,造成 17 人死亡。',
  'transcription': '同 一 个 月 又 有 一 架 客 机 冲 出 马 什 哈 德 的 跑 道 撞 上 一 堵 墙 造 成 17 人 死 亡',
  '_': '同 | 一 | 个 | 月 | 又 | 有 | 一 | 架 | 客 | 机 | 冲 | 出 | 马 | 什 | 哈 | 德 | 的 | 跑 | 道 | 撞 | 上 | 一 | 堵 | 墙 | 造 | 成 | 1 7 | 人 | 死 | 亡 |',
  'num_samples': 163200,
  'gender': 'MALE'},
 {'id': 1733,
  'file_name': '18059580157250761435.wav',
  'raw_transcription': '在这份报告的 78 项建议中,第一条建议是在今年年底之前采取新的外交行动,目的在于保护伊拉克的边界免受敌对势力的侵害,并与邻国重建外交关系。',
  'transcription': '在 这 份 报 告 的 78 项 建 议 中 第 一 条 建 议 是 在 今 年 年 底 之 前 采 取 新 的 外 交 行 动 目 的 在 于 保 护 伊 拉 克 的 边 界 免 受 敌 对 势 力 的 侵 害 并 与 邻 国 重 建 外 交 关 系',
  '_': '在 | 这 | 份 | 报 | 告 | 的 | 7 8 | 项 | 建 | 议 | 中 | 第 | 一 | 条 | 建 | 议 | 是 | 在 | 今 | 年 | 年 | 底 | 之 | 前 | 采 | 取 | 新 | 的 | 外 | 交 | 行 | 动 | 目 | 的 | 在 | 于 | 保 | 护 | 伊 | 拉 | 克 | 的 | 边 | 界 | 免 | 受 | 敌 | 对 | 势 | 力 | 的 | 侵 | 害 | 并 | 与 | 邻 | 国 | 重 | 建 | 外 | 交 | 关 | 系 |',
  'num_samples': 344640,
  'gender': 'MALE'},
 {'id': 1733,
  'file_name': '14592221532854027537.wav',
  'raw_transcription': '在这份报告的 78 项建议中,第一条建议是在今年年底之前采取新的外交行动,目的在于保护伊拉克的边界免受敌对势力的侵害,并与邻国重建外交关系。',
  'transcription': '在 这 份 报 告 的 78 项 建 议 中 第 一 条 建 议 是 在 今 年 年 底 之 前 采 取 新 的 外 交 行 动 目 的 在 于 保 护 伊 拉 克 的 边 界 免 受 敌 对 势 力 的 侵 害 并 与 邻 国 重 建 外 交 关 系',
  '_': '在 | 这 | 份 | 报 | 告 | 的 | 7 8 | 项 | 建 | 议 | 中 | 第 | 一 | 条 | 建 | 议 | 是 | 在 | 今 | 年 | 年 | 底 | 之 | 前 | 采 | 取 | 新 | 的 | 外 | 交 | 行 | 动 | 目 | 的 | 在 | 于 | 保 | 护 | 伊 | 拉 | 克 | 的 | 边 | 界 | 免 | 受 | 敌 | 对 | 势 | 力 | 的 | 侵 | 害 | 并 | 与 | 邻 | 国 | 重 | 建 | 外 | 交 | 关 | 系 |',
  'num_samples': 247680,
  'gender': 'FEMALE'},
 {'id': 1733,
  'file_name': '15094531534235658217.wav',
  'raw_transcription': '在这份报告的 78 项建议中,第一条建议是在今年年底之前采取新的外交行动,目的在于保护伊拉克的边界免受敌对势力的侵害,并与邻国重建外交关系。',
  'transcription': '在 这 份 报 告 的 78 项 建 议 中 第 一 条 建 议 是 在 今 年 年 底 之 前 采 取 新 的 外 交 行 动 目 的 在 于 保 护 伊 拉 克 的 边 界 免 受 敌 对 势 力 的 侵 害 并 与 邻 国 重 建 外 交 关 系',
  '_': '在 | 这 | 份 | 报 | 告 | 的 | 7 8 | 项 | 建 | 议 | 中 | 第 | 一 | 条 | 建 | 议 | 是 | 在 | 今 | 年 | 年 | 底 | 之 | 前 | 采 | 取 | 新 | 的 | 外 | 交 | 行 | 动 | 目 | 的 | 在 | 于 | 保 | 护 | 伊 | 拉 | 克 | 的 | 边 | 界 | 免 | 受 | 敌 | 对 | 势 | 力 | 的 | 侵 | 害 | 并 | 与 | 邻 | 国 | 重 | 建 | 外 | 交 | 关 | 系 |',
  'num_samples': 216960,
  'gender': 'FEMALE'},
 {'id': 1749,
  'file_name': '9281963460244411454.wav',
  'raw_transcription': '它由“维希”法国人统治。这些法国人在 1940 年与德国人达成了和平协议,不反抗侵略者,而是和他们合作。',
  'transcription': '它 由 维 希 法 国 人 统 治 这 些 法 国 人 在 1940 年 与 德 国 人 达 成 了 和 平 协 议 不 反 抗 侵 略 者 而 是 和 他 们 合 作',
  '_': '它 | 由 | 维 | 希 | 法 | 国 | 人 | 统 | 治 | 这 | 些 | 法 | 国 | 人 | 在 | 1 9 4 0 | 年 | 与 | 德 | 国 | 人 | 达 | 成 | 了 | 和 | 平 | 协 | 议 | 不 | 反 | 抗 | 侵 | 略 | 者 | 而 | 是 | 和 | 他 | 们 | 合 | 作 |',
  'num_samples': 189120,
  'gender': 'MALE'},
 {'id': 1749,
  'file_name': '1657435357188198589.wav',
  'raw_transcription': '它由“维希”法国人统治。这些法国人在 1940 年与德国人达成了和平协议,不反抗侵略者,而是和他们合作。',
  'transcription': '它 由 维 希 法 国 人 统 治 这 些 法 国 人 在 1940 年 与 德 国 人 达 成 了 和 平 协 议 不 反 抗 侵 略 者 而 是 和 他 们 合 作',
  '_': '它 | 由 | 维 | 希 | 法 | 国 | 人 | 统 | 治 | 这 | 些 | 法 | 国 | 人 | 在 | 1 9 4 0 | 年 | 与 | 德 | 国 | 人 | 达 | 成 | 了 | 和 | 平 | 协 | 议 | 不 | 反 | 抗 | 侵 | 略 | 者 | 而 | 是 | 和 | 他 | 们 | 合 | 作 |',
  'num_samples': 310720,
  'gender': 'MALE'},
 {'id': 1749,
  'file_name': '9898129813101250243.wav',
  'raw_transcription': '它由“维希”法国人统治。这些法国人在 1940 年与德国人达成了和平协议,不反抗侵略者,而是和他们合作。',
  'transcription': '它 由 维 希 法 国 人 统 治 这 些 法 国 人 在 1940 年 与 德 国 人 达 成 了 和 平 协 议 不 反 抗 侵 略 者 而 是 和 他 们 合 作',
  '_': '它 | 由 | 维 | 希 | 法 | 国 | 人 | 统 | 治 | 这 | 些 | 法 | 国 | 人 | 在 | 1 9 4 0 | 年 | 与 | 德 | 国 | 人 | 达 | 成 | 了 | 和 | 平 | 协 | 议 | 不 | 反 | 抗 | 侵 | 略 | 者 | 而 | 是 | 和 | 他 | 们 | 合 | 作 |',
  'num_samples': 264000,
  'gender': 'MALE'},
 {'id': 1688,
  'file_name': '14341578705184191215.wav',
  'raw_transcription': '从传统意义上讲,海军的任务是确保国家保持运输人员和货物的能力,同时,干扰敌人运输其人员和货物的能力。',
  'transcription': '从 传 统 意 义 上 讲 海 军 的 任 务 是 确 保 国 家 保 持 运 输 人 员 和 货 物 的 能 力 同 时 干 扰 敌 人 运 输 其 人 员 和 货 物 的 能 力',
  '_': '从 | 传 | 统 | 意 | 义 | 上 | 讲 | 海 | 军 | 的 | 任 | 务 | 是 | 确 | 保 | 国 | 家 | 保 | 持 | 运 | 输 | 人 | 员 | 和 | 货 | 物 | 的 | 能 | 力 | 同 | 时 | 干 | 扰 | 敌 | 人 | 运 | 输 | 其 | 人 | 员 | 和 | 货 | 物 | 的 | 能 | 力 |',
  'num_samples': 200640,
  'gender': 'FEMALE'},
 {'id': 1688,
  'file_name': '15342621548518573688.wav',
  'raw_transcription': '从传统意义上讲,海军的任务是确保国家保持运输人员和货物的能力,同时,干扰敌人运输其人员和货物的能力。',
  'transcription': '从 传 统 意 义 上 讲 海 军 的 任 务 是 确 保 国 家 保 持 运 输 人 员 和 货 物 的 能 力 同 时 干 扰 敌 人 运 输 其 人 员 和 货 物 的 能 力',
  '_': '从 | 传 | 统 | 意 | 义 | 上 | 讲 | 海 | 军 | 的 | 任 | 务 | 是 | 确 | 保 | 国 | 家 | 保 | 持 | 运 | 输 | 人 | 员 | 和 | 货 | 物 | 的 | 能 | 力 | 同 | 时 | 干 | 扰 | 敌 | 人 | 运 | 输 | 其 | 人 | 员 | 和 | 货 | 物 | 的 | 能 | 力 |',
  'num_samples': 300480,
  'gender': 'MALE'},
 {'id': 1688,
  'file_name': '3375603447046804999.wav',
  'raw_transcription': '从传统意义上讲,海军的任务是确保国家保持运输人员和货物的能力,同时,干扰敌人运输其人员和货物的能力。',
  'transcription': '从 传 统 意 义 上 讲 海 军 的 任 务 是 确 保 国 家 保 持 运 输 人 员 和 货 物 的 能 力 同 时 干 扰 敌 人 运 输 其 人 员 和 货 物 的 能 力',
  '_': '从 | 传 | 统 | 意 | 义 | 上 | 讲 | 海 | 军 | 的 | 任 | 务 | 是 | 确 | 保 | 国 | 家 | 保 | 持 | 运 | 输 | 人 | 员 | 和 | 货 | 物 | 的 | 能 | 力 | 同 | 时 | 干 | 扰 | 敌 | 人 | 运 | 输 | 其 | 人 | 员 | 和 | 货 | 物 | 的 | 能 | 力 |',
  'num_samples': 176640,
  'gender': 'FEMALE'},
 {'id': 1777,
  'file_name': '1829122290478615943.wav',
  'raw_transcription': '渥太华是加拿大的首都,富有魅力且采用使用双语制,亮点是一系列展示着加拿大过去和现在的艺术画廊和博物馆。',
  'transcription': '渥 太 华 是 加 拿 大 的 首 都 富 有 魅 力 且 采 用 使 用 双 语 制 亮 点 是 一 系 列 展 示 着 加 拿 大 过 去 和 现 在 的 艺 术 画 廊 和 博 物 馆',
  '_': '渥 | 太 | 华 | 是 | 加 | 拿 | 大 | 的 | 首 | 都 | 富 | 有 | 魅 | 力 | 且 | 采 | 用 | 使 | 用 | 双 | 语 | 制 | 亮 | 点 | 是 | 一 | 系 | 列 | 展 | 示 | 着 | 加 | 拿 | 大 | 过 | 去 | 和 | 现 | 在 | 的 | 艺 | 术 | 画 | 廊 | 和 | 博 | 物 | 馆 |',
  'num_samples': 233280,
  'gender': 'MALE'},
 {'id': 1777,
  'file_name': '9358413384056294314.wav',
  'raw_transcription': '渥太华是加拿大的首都,富有魅力且采用使用双语制,亮点是一系列展示着加拿大过去和现在的艺术画廊和博物馆。',
  'transcription': '渥 太 华 是 加 拿 大 的 首 都 富 有 魅 力 且 采 用 使 用 双 语 制 亮 点 是 一 系 列 展 示 着 加 拿 大 过 去 和 现 在 的 艺 术 画 廊 和 博 物 馆',
  '_': '渥 | 太 | 华 | 是 | 加 | 拿 | 大 | 的 | 首 | 都 | 富 | 有 | 魅 | 力 | 且 | 采 | 用 | 使 | 用 | 双 | 语 | 制 | 亮 | 点 | 是 | 一 | 系 | 列 | 展 | 示 | 着 | 加 | 拿 | 大 | 过 | 去 | 和 | 现 | 在 | 的 | 艺 | 术 | 画 | 廊 | 和 | 博 | 物 | 馆 |',
  'num_samples': 178560,
  'gender': 'MALE'},
 {'id': 1777,
  'file_name': '12915718546983056859.wav',
  'raw_transcription': '渥太华是加拿大的首都,富有魅力且采用使用双语制,亮点是一系列展示着加拿大过去和现在的艺术画廊和博物馆。',
  'transcription': '渥 太 华 是 加 拿 大 的 首 都 富 有 魅 力 且 采 用 使 用 双 语 制 亮 点 是 一 系 列 展 示 着 加 拿 大 过 去 和 现 在 的 艺 术 画 廊 和 博 物 馆',
  '_': '渥 | 太 | 华 | 是 | 加 | 拿 | 大 | 的 | 首 | 都 | 富 | 有 | 魅 | 力 | 且 | 采 | 用 | 使 | 用 | 双 | 语 | 制 | 亮 | 点 | 是 | 一 | 系 | 列 | 展 | 示 | 着 | 加 | 拿 | 大 | 过 | 去 | 和 | 现 | 在 | 的 | 艺 | 术 | 画 | 廊 | 和 | 博 | 物 | 馆 |',
  'num_samples': 165120,
  'gender': 'FEMALE'},
 {'id': 1776,
  'file_name': '12201988896952978796.wav',
  'raw_transcription': '一夜之间印刷了 150 到 200 份,就是现在众所周知的“邓拉普宽边”(Dunlap broadsides) 版。',
  'transcription': '一夜之间印刷了 150 到 200 份就是现在众所周知的 邓拉普宽边”dunlap broadsides 版',
  '_': '一 夜 之 间 印 刷 了 | 1 5 0 | 到 | 2 0 0 | 份 就 是 现 在 众 所 周 知 的 | 邓 拉 普 宽 边 ” d u n l a p | b r o a d s i d e s | 版 |',
  'num_samples': 142080,
  'gender': 'MALE'},
 {'id': 1776,
  'file_name': '1461989003321050944.wav',
  'raw_transcription': '一夜之间印刷了 150 到 200 份,就是现在众所周知的“邓拉普宽边”(Dunlap broadsides) 版。',
  'transcription': '一夜之间印刷了 150 到 200 份就是现在众所周知的 邓拉普宽边”dunlap broadsides 版',
  '_': '一 夜 之 间 印 刷 了 | 1 5 0 | 到 | 2 0 0 | 份 就 是 现 在 众 所 周 知 的 | 邓 拉 普 宽 边 ” d u n l a p | b r o a d s i d e s | 版 |',
  'num_samples': 213760,
  'gender': 'MALE'},
 {'id': 1776,
  'file_name': '2411443838993986854.wav',
  'raw_transcription': '一夜之间印刷了 150 到 200 份,就是现在众所周知的“邓拉普宽边”(Dunlap broadsides) 版。',
  'transcription': '一夜之间印刷了 150 到 200 份就是现在众所周知的 邓拉普宽边”dunlap broadsides 版',
  '_': '一 夜 之 间 印 刷 了 | 1 5 0 | 到 | 2 0 0 | 份 就 是 现 在 众 所 周 知 的 | 邓 拉 普 宽 边 ” d u n l a p | b r o a d s i d e s | 版 |',
  'num_samples': 178560,
  'gender': 'MALE'},
 {'id': 1773,
  'file_name': '14338203553003909059.wav',
  'raw_transcription': '睡眠中断是指这样的过程:在正常睡眠期间有意地醒来,并且在短时间之后(10-60分钟)睡着。',
  'transcription': '睡 眠 中 断 是 指 这 样 的 过 程 在 正 常 睡 眠 期 间 有 意 地 醒 来 并 且 在 短 时 间 之 后 10-60 分 钟 睡 着',
  '_': '睡 | 眠 | 中 | 断 | 是 | 指 | 这 | 样 | 的 | 过 | 程 | 在 | 正 | 常 | 睡 | 眠 | 期 | 间 | 有 | 意 | 地 | 醒 | 来 | 并 | 且 | 在 | 短 | 时 | 间 | 之 | 后 | 1 0 - 6 0 | 分 | 钟 | 睡 | 着 |',
  'num_samples': 270080,
  'gender': 'MALE'},
 {'id': 1773,
  'file_name': '14794761573954404767.wav',
  'raw_transcription': '睡眠中断是指这样的过程:在正常睡眠期间有意地醒来,并且在短时间之后(10-60分钟)睡着。',
  'transcription': '睡 眠 中 断 是 指 这 样 的 过 程 在 正 常 睡 眠 期 间 有 意 地 醒 来 并 且 在 短 时 间 之 后 10-60 分 钟 睡 着',
  '_': '睡 | 眠 | 中 | 断 | 是 | 指 | 这 | 样 | 的 | 过 | 程 | 在 | 正 | 常 | 睡 | 眠 | 期 | 间 | 有 | 意 | 地 | 醒 | 来 | 并 | 且 | 在 | 短 | 时 | 间 | 之 | 后 | 1 0 - 6 0 | 分 | 钟 | 睡 | 着 |',
  'num_samples': 142080,
  'gender': 'FEMALE'},
 {'id': 1773,
  'file_name': '15644660527438584919.wav',
  'raw_transcription': '睡眠中断是指这样的过程:在正常睡眠期间有意地醒来,并且在短时间之后(10-60分钟)睡着。',
  'transcription': '睡 眠 中 断 是 指 这 样 的 过 程 在 正 常 睡 眠 期 间 有 意 地 醒 来 并 且 在 短 时 间 之 后 10-60 分 钟 睡 着',
  '_': '睡 | 眠 | 中 | 断 | 是 | 指 | 这 | 样 | 的 | 过 | 程 | 在 | 正 | 常 | 睡 | 眠 | 期 | 间 | 有 | 意 | 地 | 醒 | 来 | 并 | 且 | 在 | 短 | 时 | 间 | 之 | 后 | 1 0 - 6 0 | 分 | 钟 | 睡 | 着 |',
  'num_samples': 195840,
  'gender': 'MALE'},
 {'id': 1912,
  'file_name': '12856136325121435625.wav',
  'raw_transcription': '较小的岛屿大多是独立国家,或所属于法国,它们以豪华海滩度假胜地而闻名。',
  'transcription': '较 小 的 岛 屿 大 多 是 独 立 国 家 或 所 属 于 法 国 它 们 以 豪 华 海 滩 度 假 胜 地 而 闻 名',
  '_': '较 | 小 | 的 | 岛 | 屿 | 大 | 多 | 是 | 独 | 立 | 国 | 家 | 或 | 所 | 属 | 于 | 法 | 国 | 它 | 们 | 以 | 豪 | 华 | 海 | 滩 | 度 | 假 | 胜 | 地 | 而 | 闻 | 名 |',
  'num_samples': 164160,
  'gender': 'MALE'},
 {'id': 1912,
  'file_name': '6954568593404055228.wav',
  'raw_transcription': '较小的岛屿大多是独立国家,或所属于法国,它们以豪华海滩度假胜地而闻名。',
  'transcription': '较 小 的 岛 屿 大 多 是 独 立 国 家 或 所 属 于 法 国 它 们 以 豪 华 海 滩 度 假 胜 地 而 闻 名',
  '_': '较 | 小 | 的 | 岛 | 屿 | 大 | 多 | 是 | 独 | 立 | 国 | 家 | 或 | 所 | 属 | 于 | 法 | 国 | 它 | 们 | 以 | 豪 | 华 | 海 | 滩 | 度 | 假 | 胜 | 地 | 而 | 闻 | 名 |',
  'num_samples': 159360,
  'gender': 'MALE'},
 {'id': 1708,
  'file_name': '12033218428575912024.wav',
  'raw_transcription': '胡纳已经辞职,他在内阁中的位置将由国会议员埃德·戴维 (Ed Davey) 接替。预计国会议员诺曼·兰姆 (Norman Lamb) 将接替戴维空出的商务部长一职。',
  'transcription': '胡 纳 已 经 辞 职 他 在 内 阁 中 的 位 置 将 由 国 会 议 员 埃 德 戴 维 ed davey 接 替 预 计 国 会 议 员 诺 曼 兰 姆 norman lamb 将 接 替 戴 维 空 出 的 商 务 部 长 一 职',
  '_': '胡 | 纳 | 已 | 经 | 辞 | 职 | 他 | 在 | 内 | 阁 | 中 | 的 | 位 | 置 | 将 | 由 | 国 | 会 | 议 | 员 | 埃 | 德 | 戴 | 维 | e d | d a v e y | 接 | 替 | 预 | 计 | 国 | 会 | 议 | 员 | 诺 | 曼 | 兰 | 姆 | n o r m a n | l a m b | 将 | 接 | 替 | 戴 | 维 | 空 | 出 | 的 | 商 | 务 | 部 | 长 | 一 | 职 |',
  'num_samples': 203520,
  'gender': 'FEMALE'},
 {'id': 1708,
  'file_name': '13508494454011641653.wav',
  'raw_transcription': '胡纳已经辞职,他在内阁中的位置将由国会议员埃德·戴维 (Ed Davey) 接替。预计国会议员诺曼·兰姆 (Norman Lamb) 将接替戴维空出的商务部长一职。',
  'transcription': '胡 纳 已 经 辞 职 他 在 内 阁 中 的 位 置 将 由 国 会 议 员 埃 德 戴 维 ed davey 接 替 预 计 国 会 议 员 诺 曼 兰 姆 norman lamb 将 接 替 戴 维 空 出 的 商 务 部 长 一 职',
  '_': '胡 | 纳 | 已 | 经 | 辞 | 职 | 他 | 在 | 内 | 阁 | 中 | 的 | 位 | 置 | 将 | 由 | 国 | 会 | 议 | 员 | 埃 | 德 | 戴 | 维 | e d | d a v e y | 接 | 替 | 预 | 计 | 国 | 会 | 议 | 员 | 诺 | 曼 | 兰 | 姆 | n o r m a n | l a m b | 将 | 接 | 替 | 戴 | 维 | 空 | 出 | 的 | 商 | 务 | 部 | 长 | 一 | 职 |',
  'num_samples': 260800,
  'gender': 'MALE'},
 {'id': 1708,
  'file_name': '16800865287073223265.wav',
  'raw_transcription': '胡纳已经辞职,他在内阁中的位置将由国会议员埃德·戴维 (Ed Davey) 接替。预计国会议员诺曼·兰姆 (Norman Lamb) 将接替戴维空出的商务部长一职。',
  'transcription': '胡 纳 已 经 辞 职 他 在 内 阁 中 的 位 置 将 由 国 会 议 员 埃 德 戴 维 ed davey 接 替 预 计 国 会 议 员 诺 曼 兰 姆 norman lamb 将 接 替 戴 维 空 出 的 商 务 部 长 一 职',
  '_': '胡 | 纳 | 已 | 经 | 辞 | 职 | 他 | 在 | 内 | 阁 | 中 | 的 | 位 | 置 | 将 | 由 | 国 | 会 | 议 | 员 | 埃 | 德 | 戴 | 维 | e d | d a v e y | 接 | 替 | 预 | 计 | 国 | 会 | 议 | 员 | 诺 | 曼 | 兰 | 姆 | n o r m a n | l a m b | 将 | 接 | 替 | 戴 | 维 | 空 | 出 | 的 | 商 | 务 | 部 | 长 | 一 | 职 |',
  'num_samples': 302720,
  'gender': 'MALE'},
 {'id': 1887,
  'file_name': '14643058958115530824.wav',
  'raw_transcription': '利金斯 (Liggins) 在医院工作时,开始在业余时间研究早产。',
  'transcription': '利 金 斯 liggins 在 医 院 工 作 时 开 始 在 业 余 时 间 研 究 早 产',
  '_': '利 | 金 | 斯 | l i g g i n s | 在 | 医 | 院 | 工 | 作 | 时 | 开 | 始 | 在 | 业 | 余 | 时 | 间 | 研 | 究 | 早 | 产 |',
  'num_samples': 101760,
  'gender': 'FEMALE'},
 {'id': 1887,
  'file_name': '14452059866858390995.wav',
  'raw_transcription': '利金斯 (Liggins) 在医院工作时,开始在业余时间研究早产。',
  'transcription': '利 金 斯 liggins 在 医 院 工 作 时 开 始 在 业 余 时 间 研 究 早 产',
  '_': '利 | 金 | 斯 | l i g g i n s | 在 | 医 | 院 | 工 | 作 | 时 | 开 | 始 | 在 | 业 | 余 | 时 | 间 | 研 | 究 | 早 | 产 |',
  'num_samples': 78720,
  'gender': 'FEMALE'},
 {'id': 1887,
  'file_name': '11946543238226525642.wav',
  'raw_transcription': '利金斯 (Liggins) 在医院工作时,开始在业余时间研究早产。',
  'transcription': '利 金 斯 liggins 在 医 院 工 作 时 开 始 在 业 余 时 间 研 究 早 产',
  '_': '利 | 金 | 斯 | l i g g i n s | 在 | 医 | 院 | 工 | 作 | 时 | 开 | 始 | 在 | 业 | 余 | 时 | 间 | 研 | 究 | 早 | 产 |',
  'num_samples': 225920,
  'gender': 'MALE'},
 {'id': 1945,
  'file_name': '14152107015604580647.wav',
  'raw_transcription': '卡萨布兰卡是全摩洛哥最无趣的购物地之一。',
  'transcription': '卡 萨 布 兰 卡 是 全 摩 洛 哥 最 无 趣 的 购 物 地 之 一',
  '_': '卡 | 萨 | 布 | 兰 | 卡 | 是 | 全 | 摩 | 洛 | 哥 | 最 | 无 | 趣 | 的 | 购 | 物 | 地 | 之 | 一 |',
  'num_samples': 94080,
  'gender': 'FEMALE'},
 {'id': 1945,
  'file_name': '8556305135909113392.wav',
  'raw_transcription': '卡萨布兰卡是全摩洛哥最无趣的购物地之一。',
  'transcription': '卡 萨 布 兰 卡 是 全 摩 洛 哥 最 无 趣 的 购 物 地 之 一',
  '_': '卡 | 萨 | 布 | 兰 | 卡 | 是 | 全 | 摩 | 洛 | 哥 | 最 | 无 | 趣 | 的 | 购 | 物 | 地 | 之 | 一 |',
  'num_samples': 75840,
  'gender': 'FEMALE'},
 {'id': 1945,
  'file_name': '8727036644100290926.wav',
  'raw_transcription': '卡萨布兰卡是全摩洛哥最无趣的购物地之一。',
  'transcription': '卡 萨 布 兰 卡 是 全 摩 洛 哥 最 无 趣 的 购 物 地 之 一',
  '_': '卡 | 萨 | 布 | 兰 | 卡 | 是 | 全 | 摩 | 洛 | 哥 | 最 | 无 | 趣 | 的 | 购 | 物 | 地 | 之 | 一 |',
  'num_samples': 186560,
  'gender': 'MALE'},
 {'id': 1797,
  'file_name': '18370546873797594293.wav',
  'raw_transcription': '每个人都是社会的一份子,都会使用交通系统。而几乎每个人都对交通系统有怨言。',
  'transcription': '每 个 人 都 是 社 会 的 一 份 子 都 会 使 用 交 通 系 统 而 几 乎 每 个 人 都 对 交 通 系 统 有 怨 言',
  '_': '每 | 个 | 人 | 都 | 是 | 社 | 会 | 的 | 一 | 份 | 子 | 都 | 会 | 使 | 用 | 交 | 通 | 系 | 统 | 而 | 几 | 乎 | 每 | 个 | 人 | 都 | 对 | 交 | 通 | 系 | 统 | 有 | 怨 | 言 |',
  'num_samples': 131520,
  'gender': 'MALE'},
 {'id': 1797,
  'file_name': '10892793653125285181.wav',
  'raw_transcription': '每个人都是社会的一份子,都会使用交通系统。而几乎每个人都对交通系统有怨言。',
  'transcription': '每 个 人 都 是 社 会 的 一 份 子 都 会 使 用 交 通 系 统 而 几 乎 每 个 人 都 对 交 通 系 统 有 怨 言',
  '_': '每 | 个 | 人 | 都 | 是 | 社 | 会 | 的 | 一 | 份 | 子 | 都 | 会 | 使 | 用 | 交 | 通 | 系 | 统 | 而 | 几 | 乎 | 每 | 个 | 人 | 都 | 对 | 交 | 通 | 系 | 统 | 有 | 怨 | 言 |',
  'num_samples': 143040,
  'gender': 'MALE'},
 {'id': 1797,
  'file_name': '9461042541226885784.wav',
  'raw_transcription': '每个人都是社会的一份子,都会使用交通系统。而几乎每个人都对交通系统有怨言。',
  'transcription': '每 个 人 都 是 社 会 的 一 份 子 都 会 使 用 交 通 系 统 而 几 乎 每 个 人 都 对 交 通 系 统 有 怨 言',
  '_': '每 | 个 | 人 | 都 | 是 | 社 | 会 | 的 | 一 | 份 | 子 | 都 | 会 | 使 | 用 | 交 | 通 | 系 | 统 | 而 | 几 | 乎 | 每 | 个 | 人 | 都 | 对 | 交 | 通 | 系 | 统 | 有 | 怨 | 言 |',
  'num_samples': 232960,
  'gender': 'MALE'},
 {'id': 1915,
  'file_name': '6332975539889790745.wav',
  'raw_transcription': '你可以乘坐 boda-boda(出租的摩托车)游览戈马(Goma)。短途车程的正常(当地)价格是 500 刚果法郎。',
  'transcription': '你 可 以 乘 坐 boda-boda 出 租 的 摩 托 车 游 览 戈 马 goma 短 途 车 程 的 正 常 当 地 价 格 是 500 刚 果 法 郎',
  '_': '你 | 可 | 以 | 乘 | 坐 | b o d a - b o d a | 出 | 租 | 的 | 摩 | 托 | 车 | 游 | 览 | 戈 | 马 | g o m a | 短 | 途 | 车 | 程 | 的 | 正 | 常 | 当 | 地 | 价 | 格 | 是 | 5 0 0 | 刚 | 果 | 法 | 郎 |',
  'num_samples': 144000,
  'gender': 'FEMALE'},
 {'id': 1915,
  'file_name': '8804175767252023296.wav',
  'raw_transcription': '你可以乘坐 boda-boda(出租的摩托车)游览戈马(Goma)。短途车程的正常(当地)价格是 500 刚果法郎。',
  'transcription': '你 可 以 乘 坐 boda-boda 出 租 的 摩 托 车 游 览 戈 马 goma 短 途 车 程 的 正 常 当 地 价 格 是 500 刚 果 法 郎',
  '_': '你 | 可 | 以 | 乘 | 坐 | b o d a - b o d a | 出 | 租 | 的 | 摩 | 托 | 车 | 游 | 览 | 戈 | 马 | g o m a | 短 | 途 | 车 | 程 | 的 | 正 | 常 | 当 | 地 | 价 | 格 | 是 | 5 0 0 | 刚 | 果 | 法 | 郎 |',
  'num_samples': 282560,
  'gender': 'MALE'},
 {'id': 1915,
  'file_name': '6453896711002806613.wav',
  'raw_transcription': '你可以乘坐 boda-boda(出租的摩托车)游览戈马(Goma)。短途车程的正常(当地)价格是 500 刚果法郎。',
  'transcription': '你 可 以 乘 坐 boda-boda 出 租 的 摩 托 车 游 览 戈 马 goma 短 途 车 程 的 正 常 当 地 价 格 是 500 刚 果 法 郎',
  '_': '你 | 可 | 以 | 乘 | 坐 | b o d a - b o d a | 出 | 租 | 的 | 摩 | 托 | 车 | 游 | 览 | 戈 | 马 | g o m a | 短 | 途 | 车 | 程 | 的 | 正 | 常 | 当 | 地 | 价 | 格 | 是 | 5 0 0 | 刚 | 果 | 法 | 郎 |',
  'num_samples': 172800,
  'gender': 'FEMALE'},
 {'id': 2005,
  'file_name': '18406252259550691536.wav',
  'raw_transcription': '但鸟类还是有很多地方跟恐龙相似。',
  'transcription': '但 鸟 类 还 是 有 很 多 地 方 跟 恐 龙 相 似',
  '_': '但 | 鸟 | 类 | 还 | 是 | 有 | 很 | 多 | 地 | 方 | 跟 | 恐 | 龙 | 相 | 似 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 2005,
  'file_name': '11432051235656569325.wav',
  'raw_transcription': '但鸟类还是有很多地方跟恐龙相似。',
  'transcription': '但 鸟 类 还 是 有 很 多 地 方 跟 恐 龙 相 似',
  '_': '但 | 鸟 | 类 | 还 | 是 | 有 | 很 | 多 | 地 | 方 | 跟 | 恐 | 龙 | 相 | 似 |',
  'num_samples': 75840,
  'gender': 'FEMALE'},
 {'id': 2005,
  'file_name': '17381936933530140952.wav',
  'raw_transcription': '但鸟类还是有很多地方跟恐龙相似。',
  'transcription': '但 鸟 类 还 是 有 很 多 地 方 跟 恐 龙 相 似',
  '_': '但 | 鸟 | 类 | 还 | 是 | 有 | 很 | 多 | 地 | 方 | 跟 | 恐 | 龙 | 相 | 似 |',
  'num_samples': 98880,
  'gender': 'MALE'},
 {'id': 1925,
  'file_name': '6849942069308921648.wav',
  'raw_transcription': '完成的工作大多是理论性的,但编写程序的目的,是为了模拟对人马座星系的观测。',
  'transcription': '完 成 的 工 作 大 多 是 理 论 性 的 但 编 写 程 序 的 目 的 是 为 了 模 拟 对 人 马 座 星 系 的 观 测',
  '_': '完 | 成 | 的 | 工 | 作 | 大 | 多 | 是 | 理 | 论 | 性 | 的 | 但 | 编 | 写 | 程 | 序 | 的 | 目 | 的 | 是 | 为 | 了 | 模 | 拟 | 对 | 人 | 马 | 座 | 星 | 系 | 的 | 观 | 测 |',
  'num_samples': 158400,
  'gender': 'MALE'},
 {'id': 1925,
  'file_name': '14192991371425576281.wav',
  'raw_transcription': '完成的工作大多是理论性的,但编写程序的目的,是为了模拟对人马座星系的观测。',
  'transcription': '完 成 的 工 作 大 多 是 理 论 性 的 但 编 写 程 序 的 目 的 是 为 了 模 拟 对 人 马 座 星 系 的 观 测',
  '_': '完 | 成 | 的 | 工 | 作 | 大 | 多 | 是 | 理 | 论 | 性 | 的 | 但 | 编 | 写 | 程 | 序 | 的 | 目 | 的 | 是 | 为 | 了 | 模 | 拟 | 对 | 人 | 马 | 座 | 星 | 系 | 的 | 观 | 测 |',
  'num_samples': 133440,
  'gender': 'FEMALE'},
 {'id': 1925,
  'file_name': '3968524272588286820.wav',
  'raw_transcription': '完成的工作大多是理论性的,但编写程序的目的,是为了模拟对人马座星系的观测。',
  'transcription': '完 成 的 工 作 大 多 是 理 论 性 的 但 编 写 程 序 的 目 的 是 为 了 模 拟 对 人 马 座 星 系 的 观 测',
  '_': '完 | 成 | 的 | 工 | 作 | 大 | 多 | 是 | 理 | 论 | 性 | 的 | 但 | 编 | 写 | 程 | 序 | 的 | 目 | 的 | 是 | 为 | 了 | 模 | 拟 | 对 | 人 | 马 | 座 | 星 | 系 | 的 | 观 | 测 |',
  'num_samples': 143040,
  'gender': 'MALE'},
 {'id': 1980,
  'file_name': '15653257910115851022.wav',
  'raw_transcription': '遗憾的是,研究车流很困难,因为不能对驾驶员的行为进行百分之百确定的预测。',
  'transcription': '遗 憾 的 是 研 究 车 流 很 困 难 因 为 不 能 对 驾 驶 员 的 行 为 进 行 百 分 之 百 确 定 的 预 测',
  '_': '遗 | 憾 | 的 | 是 | 研 | 究 | 车 | 流 | 很 | 困 | 难 | 因 | 为 | 不 | 能 | 对 | 驾 | 驶 | 员 | 的 | 行 | 为 | 进 | 行 | 百 | 分 | 之 | 百 | 确 | 定 | 的 | 预 | 测 |',
  'num_samples': 174080,
  'gender': 'MALE'},
 {'id': 1980,
  'file_name': '14720635504457340087.wav',
  'raw_transcription': '遗憾的是,研究车流很困难,因为不能对驾驶员的行为进行百分之百确定的预测。',
  'transcription': '遗 憾 的 是 研 究 车 流 很 困 难 因 为 不 能 对 驾 驶 员 的 行 为 进 行 百 分 之 百 确 定 的 预 测',
  '_': '遗 | 憾 | 的 | 是 | 研 | 究 | 车 | 流 | 很 | 困 | 难 | 因 | 为 | 不 | 能 | 对 | 驾 | 驶 | 员 | 的 | 行 | 为 | 进 | 行 | 百 | 分 | 之 | 百 | 确 | 定 | 的 | 预 | 测 |',
  'num_samples': 109440,
  'gender': 'FEMALE'},
 {'id': 1980,
  'file_name': '5010491765270092956.wav',
  'raw_transcription': '遗憾的是,研究车流很困难,因为不能对驾驶员的行为进行百分之百确定的预测。',
  'transcription': '遗 憾 的 是 研 究 车 流 很 困 难 因 为 不 能 对 驾 驶 员 的 行 为 进 行 百 分 之 百 确 定 的 预 测',
  '_': '遗 | 憾 | 的 | 是 | 研 | 究 | 车 | 流 | 很 | 困 | 难 | 因 | 为 | 不 | 能 | 对 | 驾 | 驶 | 员 | 的 | 行 | 为 | 进 | 行 | 百 | 分 | 之 | 百 | 确 | 定 | 的 | 预 | 测 |',
  'num_samples': 176960,
  'gender': 'MALE'},
 {'id': 1855,
  'file_name': '608809329260395375.wav',
  'raw_transcription': '狮群的行为与狼群或狗群非常类似。这些动物与狮子的行为惊人地相似(但与其他大型猫科动物不同),而且这些行为对它们的猎物来说也是非常致命的。',
  'transcription': '狮 群 的 行 为 与 狼 群 或 狗 群 非 常 类 似 这 些 动 物 与 狮 子 的 行 为 惊 人 地 相 似 但 与 其 他 大 型 猫 科 动 物 不 同 而 且 这 些 行 为 对 它 们 的 猎 物 来 说 也 是 非 常 致 命 的',
  '_': '狮 | 群 | 的 | 行 | 为 | 与 | 狼 | 群 | 或 | 狗 | 群 | 非 | 常 | 类 | 似 | 这 | 些 | 动 | 物 | 与 | 狮 | 子 | 的 | 行 | 为 | 惊 | 人 | 地 | 相 | 似 | 但 | 与 | 其 | 他 | 大 | 型 | 猫 | 科 | 动 | 物 | 不 | 同 | 而 | 且 | 这 | 些 | 行 | 为 | 对 | 它 | 们 | 的 | 猎 | 物 | 来 | 说 | 也 | 是 | 非 | 常 | 致 | 命 | 的 |',
  'num_samples': 358080,
  'gender': 'MALE'},
 {'id': 1855,
  'file_name': '15841828445498597171.wav',
  'raw_transcription': '狮群的行为与狼群或狗群非常类似。这些动物与狮子的行为惊人地相似(但与其他大型猫科动物不同),而且这些行为对它们的猎物来说也是非常致命的。',
  'transcription': '狮 群 的 行 为 与 狼 群 或 狗 群 非 常 类 似 这 些 动 物 与 狮 子 的 行 为 惊 人 地 相 似 但 与 其 他 大 型 猫 科 动 物 不 同 而 且 这 些 行 为 对 它 们 的 猎 物 来 说 也 是 非 常 致 命 的',
  '_': '狮 | 群 | 的 | 行 | 为 | 与 | 狼 | 群 | 或 | 狗 | 群 | 非 | 常 | 类 | 似 | 这 | 些 | 动 | 物 | 与 | 狮 | 子 | 的 | 行 | 为 | 惊 | 人 | 地 | 相 | 似 | 但 | 与 | 其 | 他 | 大 | 型 | 猫 | 科 | 动 | 物 | 不 | 同 | 而 | 且 | 这 | 些 | 行 | 为 | 对 | 它 | 们 | 的 | 猎 | 物 | 来 | 说 | 也 | 是 | 非 | 常 | 致 | 命 | 的 |',
  'num_samples': 208320,
  'gender': 'FEMALE'},
 {'id': 1855,
  'file_name': '2242556771705152219.wav',
  'raw_transcription': '狮群的行为与狼群或狗群非常类似。这些动物与狮子的行为惊人地相似(但与其他大型猫科动物不同),而且这些行为对它们的猎物来说也是非常致命的。',
  'transcription': '狮 群 的 行 为 与 狼 群 或 狗 群 非 常 类 似 这 些 动 物 与 狮 子 的 行 为 惊 人 地 相 似 但 与 其 他 大 型 猫 科 动 物 不 同 而 且 这 些 行 为 对 它 们 的 猎 物 来 说 也 是 非 常 致 命 的',
  '_': '狮 | 群 | 的 | 行 | 为 | 与 | 狼 | 群 | 或 | 狗 | 群 | 非 | 常 | 类 | 似 | 这 | 些 | 动 | 物 | 与 | 狮 | 子 | 的 | 行 | 为 | 惊 | 人 | 地 | 相 | 似 | 但 | 与 | 其 | 他 | 大 | 型 | 猫 | 科 | 动 | 物 | 不 | 同 | 而 | 且 | 这 | 些 | 行 | 为 | 对 | 它 | 们 | 的 | 猎 | 物 | 来 | 说 | 也 | 是 | 非 | 常 | 致 | 命 | 的 |',
  'num_samples': 230400,
  'gender': 'MALE'},
 {'id': 1913,
  'file_name': '7517623342057080448.wav',
  'raw_transcription': '老虎的咆哮不像狮子的咆哮那样深沉,而更像一句生气嘶吼的话语。',
  'transcription': '老 虎 的 咆 哮 不 像 狮 子 的 咆 哮 那 样 深 沉 而 更 像 一 句 生 气 嘶 吼 的 话 语',
  '_': '老 | 虎 | 的 | 咆 | 哮 | 不 | 像 | 狮 | 子 | 的 | 咆 | 哮 | 那 | 样 | 深 | 沉 | 而 | 更 | 像 | 一 | 句 | 生 | 气 | 嘶 | 吼 | 的 | 话 | 语 |',
  'num_samples': 119040,
  'gender': 'FEMALE'},
 {'id': 1913,
  'file_name': '17986635558340082573.wav',
  'raw_transcription': '老虎的咆哮不像狮子的咆哮那样深沉,而更像一句生气嘶吼的话语。',
  'transcription': '老 虎 的 咆 哮 不 像 狮 子 的 咆 哮 那 样 深 沉 而 更 像 一 句 生 气 嘶 吼 的 话 语',
  '_': '老 | 虎 | 的 | 咆 | 哮 | 不 | 像 | 狮 | 子 | 的 | 咆 | 哮 | 那 | 样 | 深 | 沉 | 而 | 更 | 像 | 一 | 句 | 生 | 气 | 嘶 | 吼 | 的 | 话 | 语 |',
  'num_samples': 209600,
  'gender': 'MALE'},
 {'id': 1913,
  'file_name': '1591685339240118661.wav',
  'raw_transcription': '老虎的咆哮不像狮子的咆哮那样深沉,而更像一句生气嘶吼的话语。',
  'transcription': '老 虎 的 咆 哮 不 像 狮 子 的 咆 哮 那 样 深 沉 而 更 像 一 句 生 气 嘶 吼 的 话 语',
  '_': '老 | 虎 | 的 | 咆 | 哮 | 不 | 像 | 狮 | 子 | 的 | 咆 | 哮 | 那 | 样 | 深 | 沉 | 而 | 更 | 像 | 一 | 句 | 生 | 气 | 嘶 | 吼 | 的 | 话 | 语 |',
  'num_samples': 186560,
  'gender': 'MALE'},
 {'id': 1840,
  'file_name': '4238567069238818321.wav',
  'raw_transcription': '在意大利很多其他城市以及世界上其他地方,尤其是波兰,都设置了类似的设施,以供大量群众观看。',
  'transcription': '在 意 大 利 很 多 其 他 城 市 以 及 世 界 上 其 他 地 方 尤 其 是 波 兰 都 设 置 了 类 似 的 设 施 以 供 大 量 群 众 观 看',
  '_': '在 | 意 | 大 | 利 | 很 | 多 | 其 | 他 | 城 | 市 | 以 | 及 | 世 | 界 | 上 | 其 | 他 | 地 | 方 | 尤 | 其 | 是 | 波 | 兰 | 都 | 设 | 置 | 了 | 类 | 似 | 的 | 设 | 施 | 以 | 供 | 大 | 量 | 群 | 众 | 观 | 看 |',
  'num_samples': 149760,
  'gender': 'FEMALE'},
 {'id': 1840,
  'file_name': '11545158540803261075.wav',
  'raw_transcription': '在意大利很多其他城市以及世界上其他地方,尤其是波兰,都设置了类似的设施,以供大量群众观看。',
  'transcription': '在 意 大 利 很 多 其 他 城 市 以 及 世 界 上 其 他 地 方 尤 其 是 波 兰 都 设 置 了 类 似 的 设 施 以 供 大 量 群 众 观 看',
  '_': '在 | 意 | 大 | 利 | 很 | 多 | 其 | 他 | 城 | 市 | 以 | 及 | 世 | 界 | 上 | 其 | 他 | 地 | 方 | 尤 | 其 | 是 | 波 | 兰 | 都 | 设 | 置 | 了 | 类 | 似 | 的 | 设 | 施 | 以 | 供 | 大 | 量 | 群 | 众 | 观 | 看 |',
  'num_samples': 212160,
  'gender': 'MALE'},
 {'id': 1840,
  'file_name': '3463968674772957535.wav',
  'raw_transcription': '在意大利很多其他城市以及世界上其他地方,尤其是波兰,都设置了类似的设施,以供大量群众观看。',
  'transcription': '在 意 大 利 很 多 其 他 城 市 以 及 世 界 上 其 他 地 方 尤 其 是 波 兰 都 设 置 了 类 似 的 设 施 以 供 大 量 群 众 观 看',
  '_': '在 | 意 | 大 | 利 | 很 | 多 | 其 | 他 | 城 | 市 | 以 | 及 | 世 | 界 | 上 | 其 | 他 | 地 | 方 | 尤 | 其 | 是 | 波 | 兰 | 都 | 设 | 置 | 了 | 类 | 似 | 的 | 设 | 施 | 以 | 供 | 大 | 量 | 群 | 众 | 观 | 看 |',
  'num_samples': 264000,
  'gender': 'MALE'},
 {'id': 1722,
  'file_name': '9041813900151153793.wav',
  'raw_transcription': '现年 53 岁的库莫(Cuomo)从今年年初开始担任州长,并于上个月签署了一项将同性婚姻合法化的法案。',
  'transcription': '现 年 53 岁 的 库 莫 cuomo 从 今 年 年 初 开 始 担 任 州 长 并 于 上 个 月 签 署 了 一 项 将 同 性 婚 姻 合 法 化 的 法 案',
  '_': '现 | 年 | 5 3 | 岁 | 的 | 库 | 莫 | c u o m o | 从 | 今 | 年 | 年 | 初 | 开 | 始 | 担 | 任 | 州 | 长 | 并 | 于 | 上 | 个 | 月 | 签 | 署 | 了 | 一 | 项 | 将 | 同 | 性 | 婚 | 姻 | 合 | 法 | 化 | 的 | 法 | 案 |',
  'num_samples': 153600,
  'gender': 'FEMALE'},
 {'id': 1722,
  'file_name': '6849188727409406976.wav',
  'raw_transcription': '现年 53 岁的库莫(Cuomo)从今年年初开始担任州长,并于上个月签署了一项将同性婚姻合法化的法案。',
  'transcription': '现 年 53 岁 的 库 莫 cuomo 从 今 年 年 初 开 始 担 任 州 长 并 于 上 个 月 签 署 了 一 项 将 同 性 婚 姻 合 法 化 的 法 案',
  '_': '现 | 年 | 5 3 | 岁 | 的 | 库 | 莫 | c u o m o | 从 | 今 | 年 | 年 | 初 | 开 | 始 | 担 | 任 | 州 | 长 | 并 | 于 | 上 | 个 | 月 | 签 | 署 | 了 | 一 | 项 | 将 | 同 | 性 | 婚 | 姻 | 合 | 法 | 化 | 的 | 法 | 案 |',
  'num_samples': 224960,
  'gender': 'MALE'},
 {'id': 1722,
  'file_name': '9684471246688178750.wav',
  'raw_transcription': '现年 53 岁的库莫(Cuomo)从今年年初开始担任州长,并于上个月签署了一项将同性婚姻合法化的法案。',
  'transcription': '现 年 53 岁 的 库 莫 cuomo 从 今 年 年 初 开 始 担 任 州 长 并 于 上 个 月 签 署 了 一 项 将 同 性 婚 姻 合 法 化 的 法 案',
  '_': '现 | 年 | 5 3 | 岁 | 的 | 库 | 莫 | c u o m o | 从 | 今 | 年 | 年 | 初 | 开 | 始 | 担 | 任 | 州 | 长 | 并 | 于 | 上 | 个 | 月 | 签 | 署 | 了 | 一 | 项 | 将 | 同 | 性 | 婚 | 姻 | 合 | 法 | 化 | 的 | 法 | 案 |',
  'num_samples': 287680,
  'gender': 'MALE'},
 {'id': 1756,
  'file_name': '16371443983723051577.wav',
  'raw_transcription': '周日晚些时候,美国总统唐纳德·特朗普通过新闻秘书发表声明,宣布美军将撤离叙利亚。',
  'transcription': '周 日 晚 些 时 候 美 国 总 统 唐 纳 德 特 朗 普 通 过 新 闻 秘 书 发 表 声 明 宣 布 美 军 将 撤 离 叙 利 亚',
  '_': '周 | 日 | 晚 | 些 | 时 | 候 | 美 | 国 | 总 | 统 | 唐 | 纳 | 德 | 特 | 朗 | 普 | 通 | 过 | 新 | 闻 | 秘 | 书 | 发 | 表 | 声 | 明 | 宣 | 布 | 美 | 军 | 将 | 撤 | 离 | 叙 | 利 | 亚 |',
  'num_samples': 218560,
  'gender': 'MALE'},
 {'id': 1756,
  'file_name': '7533342573159385523.wav',
  'raw_transcription': '周日晚些时候,美国总统唐纳德·特朗普通过新闻秘书发表声明,宣布美军将撤离叙利亚。',
  'transcription': '周 日 晚 些 时 候 美 国 总 统 唐 纳 德 特 朗 普 通 过 新 闻 秘 书 发 表 声 明 宣 布 美 军 将 撤 离 叙 利 亚',
  '_': '周 | 日 | 晚 | 些 | 时 | 候 | 美 | 国 | 总 | 统 | 唐 | 纳 | 德 | 特 | 朗 | 普 | 通 | 过 | 新 | 闻 | 秘 | 书 | 发 | 表 | 声 | 明 | 宣 | 布 | 美 | 军 | 将 | 撤 | 离 | 叙 | 利 | 亚 |',
  'num_samples': 181440,
  'gender': 'MALE'},
 {'id': 1756,
  'file_name': '14277226726001496901.wav',
  'raw_transcription': '周日晚些时候,美国总统唐纳德·特朗普通过新闻秘书发表声明,宣布美军将撤离叙利亚。',
  'transcription': '周 日 晚 些 时 候 美 国 总 统 唐 纳 德 特 朗 普 通 过 新 闻 秘 书 发 表 声 明 宣 布 美 军 将 撤 离 叙 利 亚',
  '_': '周 | 日 | 晚 | 些 | 时 | 候 | 美 | 国 | 总 | 统 | 唐 | 纳 | 德 | 特 | 朗 | 普 | 通 | 过 | 新 | 闻 | 秘 | 书 | 发 | 表 | 声 | 明 | 宣 | 布 | 美 | 军 | 将 | 撤 | 离 | 叙 | 利 | 亚 |',
  'num_samples': 135360,
  'gender': 'FEMALE'},
 {'id': 1985,
  'file_name': '14547706008031241011.wav',
  'raw_transcription': '这项活动与阿尔卑斯式滑雪旅行或登山运动相关,但通常不会进行这两项活动。这两项活动要在陡峭的地形上进行,而且需要更硬的滑雪板和靴子。',
  'transcription': '这 项 活 动 与 阿 尔 卑 斯 式 滑 雪 旅 行 或 登 山 运 动 相 关 但 通 常 不 会 进 行 这 两 项 活 动 这 两 项 活 动 要 在 陡 峭 的 地 形 上 进 行 而 且 需 要 更 硬 的 滑 雪 板 和 靴 子',
  '_': '这 | 项 | 活 | 动 | 与 | 阿 | 尔 | 卑 | 斯 | 式 | 滑 | 雪 | 旅 | 行 | 或 | 登 | 山 | 运 | 动 | 相 | 关 | 但 | 通 | 常 | 不 | 会 | 进 | 行 | 这 | 两 | 项 | 活 | 动 | 这 | 两 | 项 | 活 | 动 | 要 | 在 | 陡 | 峭 | 的 | 地 | 形 | 上 | 进 | 行 | 而 | 且 | 需 | 要 | 更 | 硬 | 的 | 滑 | 雪 | 板 | 和 | 靴 | 子 |',
  'num_samples': 192000,
  'gender': 'FEMALE'},
 {'id': 1985,
  'file_name': '1215560656800460606.wav',
  'raw_transcription': '这项活动与阿尔卑斯式滑雪旅行或登山运动相关,但通常不会进行这两项活动。这两项活动要在陡峭的地形上进行,而且需要更硬的滑雪板和靴子。',
  'transcription': '这 项 活 动 与 阿 尔 卑 斯 式 滑 雪 旅 行 或 登 山 运 动 相 关 但 通 常 不 会 进 行 这 两 项 活 动 这 两 项 活 动 要 在 陡 峭 的 地 形 上 进 行 而 且 需 要 更 硬 的 滑 雪 板 和 靴 子',
  '_': '这 | 项 | 活 | 动 | 与 | 阿 | 尔 | 卑 | 斯 | 式 | 滑 | 雪 | 旅 | 行 | 或 | 登 | 山 | 运 | 动 | 相 | 关 | 但 | 通 | 常 | 不 | 会 | 进 | 行 | 这 | 两 | 项 | 活 | 动 | 这 | 两 | 项 | 活 | 动 | 要 | 在 | 陡 | 峭 | 的 | 地 | 形 | 上 | 进 | 行 | 而 | 且 | 需 | 要 | 更 | 硬 | 的 | 滑 | 雪 | 板 | 和 | 靴 | 子 |',
  'num_samples': 212160,
  'gender': 'FEMALE'},
 {'id': 1774,
  'file_name': '11980122233546007204.wav',
  'raw_transcription': '在外围岛屿,可能无法使用信用卡,但可以使用英美货币;请事先与房主联系,确认可接受的付款方式。',
  'transcription': '在 外 围 岛 屿 可 能 无 法 使 用 信 用 卡 但 可 以 使 用 英 美 货 币 请 事 先 与 房 主 联 系 确 认 可 接 受 的 付 款 方 式',
  '_': '在 | 外 | 围 | 岛 | 屿 | 可 | 能 | 无 | 法 | 使 | 用 | 信 | 用 | 卡 | 但 | 可 | 以 | 使 | 用 | 英 | 美 | 货 | 币 | 请 | 事 | 先 | 与 | 房 | 主 | 联 | 系 | 确 | 认 | 可 | 接 | 受 | 的 | 付 | 款 | 方 | 式 |',
  'num_samples': 166080,
  'gender': 'MALE'},
 {'id': 1774,
  'file_name': '8601126973529337241.wav',
  'raw_transcription': '在外围岛屿,可能无法使用信用卡,但可以使用英美货币;请事先与房主联系,确认可接受的付款方式。',
  'transcription': '在 外 围 岛 屿 可 能 无 法 使 用 信 用 卡 但 可 以 使 用 英 美 货 币 请 事 先 与 房 主 联 系 确 认 可 接 受 的 付 款 方 式',
  '_': '在 | 外 | 围 | 岛 | 屿 | 可 | 能 | 无 | 法 | 使 | 用 | 信 | 用 | 卡 | 但 | 可 | 以 | 使 | 用 | 英 | 美 | 货 | 币 | 请 | 事 | 先 | 与 | 房 | 主 | 联 | 系 | 确 | 认 | 可 | 接 | 受 | 的 | 付 | 款 | 方 | 式 |',
  'num_samples': 156480,
  'gender': 'FEMALE'},
 {'id': 1774,
  'file_name': '7682114471061283954.wav',
  'raw_transcription': '在外围岛屿,可能无法使用信用卡,但可以使用英美货币;请事先与房主联系,确认可接受的付款方式。',
  'transcription': '在 外 围 岛 屿 可 能 无 法 使 用 信 用 卡 但 可 以 使 用 英 美 货 币 请 事 先 与 房 主 联 系 确 认 可 接 受 的 付 款 方 式',
  '_': '在 | 外 | 围 | 岛 | 屿 | 可 | 能 | 无 | 法 | 使 | 用 | 信 | 用 | 卡 | 但 | 可 | 以 | 使 | 用 | 英 | 美 | 货 | 币 | 请 | 事 | 先 | 与 | 房 | 主 | 联 | 系 | 确 | 认 | 可 | 接 | 受 | 的 | 付 | 款 | 方 | 式 |',
  'num_samples': 273920,
  'gender': 'MALE'},
 {'id': 1866,
  'file_name': '5015535883847905629.wav',
  'raw_transcription': '首先,大多数骑马人会穿带跟马靴,而且鞋底光滑及相当狭窄。',
  'transcription': '首 先 大 多 数 骑 马 人 会 穿 带 跟 马 靴 而 且 鞋 底 光 滑 及 相 当 狭 窄',
  '_': '首 | 先 | 大 | 多 | 数 | 骑 | 马 | 人 | 会 | 穿 | 带 | 跟 | 马 | 靴 | 而 | 且 | 鞋 | 底 | 光 | 滑 | 及 | 相 | 当 | 狭 | 窄 |',
  'num_samples': 132480,
  'gender': 'FEMALE'},
 {'id': 1866,
  'file_name': '15209730399349565944.wav',
  'raw_transcription': '首先,大多数骑马人会穿带跟马靴,而且鞋底光滑及相当狭窄。',
  'transcription': '首 先 大 多 数 骑 马 人 会 穿 带 跟 马 靴 而 且 鞋 底 光 滑 及 相 当 狭 窄',
  '_': '首 | 先 | 大 | 多 | 数 | 骑 | 马 | 人 | 会 | 穿 | 带 | 跟 | 马 | 靴 | 而 | 且 | 鞋 | 底 | 光 | 滑 | 及 | 相 | 当 | 狭 | 窄 |',
  'num_samples': 250240,
  'gender': 'MALE'},
 {'id': 1715,
  'file_name': '16257967934208170307.wav',
  'raw_transcription': '地铁里的定期广播只有加泰罗尼亚语,但自动系统会用多种语言进行临时广播,包括西班牙语、英语、法语、阿拉伯语和日语。',
  'transcription': '地 铁 里 的 定 期 广 播 只 有 加 泰 罗 尼 亚 语 但 自 动 系 统 会 用 多 种 语 言 进 行 临 时 广 播 包 括 西 班 牙 语 英 语 法 语 阿 拉 伯 语 和 日 语',
  '_': '地 | 铁 | 里 | 的 | 定 | 期 | 广 | 播 | 只 | 有 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 但 | 自 | 动 | 系 | 统 | 会 | 用 | 多 | 种 | 语 | 言 | 进 | 行 | 临 | 时 | 广 | 播 | 包 | 括 | 西 | 班 | 牙 | 语 | 英 | 语 | 法 | 语 | 阿 | 拉 | 伯 | 语 | 和 | 日 | 语 |',
  'num_samples': 232320,
  'gender': 'MALE'},
 {'id': 1715,
  'file_name': '6389647066374133474.wav',
  'raw_transcription': '地铁里的定期广播只有加泰罗尼亚语,但自动系统会用多种语言进行临时广播,包括西班牙语、英语、法语、阿拉伯语和日语。',
  'transcription': '地 铁 里 的 定 期 广 播 只 有 加 泰 罗 尼 亚 语 但 自 动 系 统 会 用 多 种 语 言 进 行 临 时 广 播 包 括 西 班 牙 语 英 语 法 语 阿 拉 伯 语 和 日 语',
  '_': '地 | 铁 | 里 | 的 | 定 | 期 | 广 | 播 | 只 | 有 | 加 | 泰 | 罗 | 尼 | 亚 | 语 | 但 | 自 | 动 | 系 | 统 | 会 | 用 | 多 | 种 | 语 | 言 | 进 | 行 | 临 | 时 | 广 | 播 | 包 | 括 | 西 | 班 | 牙 | 语 | 英 | 语 | 法 | 语 | 阿 | 拉 | 伯 | 语 | 和 | 日 | 语 |',
  'num_samples': 181440,
  'gender': 'FEMALE'},
 {'id': 1814,
  'file_name': '4851862219427809965.wav',
  'raw_transcription': '氢离子是失去了电子的质子(因为氢原子由一个质子和一个电子组成)。',
  'transcription': '氢 离 子 是 失 去 了 电 子 的 质 子 因 为 氢 原 子 由 一 个 质 子 和 一 个 电 子 组 成',
  '_': '氢 | 离 | 子 | 是 | 失 | 去 | 了 | 电 | 子 | 的 | 质 | 子 | 因 | 为 | 氢 | 原 | 子 | 由 | 一 | 个 | 质 | 子 | 和 | 一 | 个 | 电 | 子 | 组 | 成 |',
  'num_samples': 188800,
  'gender': 'MALE'},
 {'id': 1814,
  'file_name': '11355960588560603456.wav',
  'raw_transcription': '氢离子是失去了电子的质子(因为氢原子由一个质子和一个电子组成)。',
  'transcription': '氢 离 子 是 失 去 了 电 子 的 质 子 因 为 氢 原 子 由 一 个 质 子 和 一 个 电 子 组 成',
  '_': '氢 | 离 | 子 | 是 | 失 | 去 | 了 | 电 | 子 | 的 | 质 | 子 | 因 | 为 | 氢 | 原 | 子 | 由 | 一 | 个 | 质 | 子 | 和 | 一 | 个 | 电 | 子 | 组 | 成 |',
  'num_samples': 120000,
  'gender': 'FEMALE'},
 {'id': 1770,
  'file_name': '4959559813542108878.wav',
  'raw_transcription': '这似乎是合理的,因为地球感觉不到自己在移动,不是吗?',
  'transcription': '这 似 乎 是 合 理 的 因 为 地 球 感 觉 不 到 自 己 在 移 动 不 是 吗',
  '_': '这 | 似 | 乎 | 是 | 合 | 理 | 的 | 因 | 为 | 地 | 球 | 感 | 觉 | 不 | 到 | 自 | 己 | 在 | 移 | 动 | 不 | 是 | 吗 |',
  'num_samples': 95040,
  'gender': 'FEMALE'},
 {'id': 1770,
  'file_name': '13070653319996818577.wav',
  'raw_transcription': '这似乎是合理的,因为地球感觉不到自己在移动,不是吗?',
  'transcription': '这 似 乎 是 合 理 的 因 为 地 球 感 觉 不 到 自 己 在 移 动 不 是 吗',
  '_': '这 | 似 | 乎 | 是 | 合 | 理 | 的 | 因 | 为 | 地 | 球 | 感 | 觉 | 不 | 到 | 自 | 己 | 在 | 移 | 动 | 不 | 是 | 吗 |',
  'num_samples': 115200,
  'gender': 'MALE'},
 {'id': 1770,
  'file_name': '4189918329791232732.wav',
  'raw_transcription': '这似乎是合理的,因为地球感觉不到自己在移动,不是吗?',
  'transcription': '这 似 乎 是 合 理 的 因 为 地 球 感 觉 不 到 自 己 在 移 动 不 是 吗',
  '_': '这 | 似 | 乎 | 是 | 合 | 理 | 的 | 因 | 为 | 地 | 球 | 感 | 觉 | 不 | 到 | 自 | 己 | 在 | 移 | 动 | 不 | 是 | 吗 |',
  'num_samples': 168320,
  'gender': 'MALE'},
 {'id': 1739,
  'file_name': '2448556709976265821.wav',
  'raw_transcription': '该洞穴坐落在麦加 (Mecca) 北部的一座山顶上,与外界完全隔绝。',
  'transcription': '该 洞 穴 坐 落 在 麦 加 mecca 北 部 的 一 座 山 顶 上 与 外 界 完 全 隔 绝',
  '_': '该 | 洞 | 穴 | 坐 | 落 | 在 | 麦 | 加 | m e c c a | 北 | 部 | 的 | 一 | 座 | 山 | 顶 | 上 | 与 | 外 | 界 | 完 | 全 | 隔 | 绝 |',
  'num_samples': 177600,
  'gender': 'MALE'},
 {'id': 1739,
  'file_name': '7460031176312737631.wav',
  'raw_transcription': '该洞穴坐落在麦加 (Mecca) 北部的一座山顶上,与外界完全隔绝。',
  'transcription': '该 洞 穴 坐 落 在 麦 加 mecca 北 部 的 一 座 山 顶 上 与 外 界 完 全 隔 绝',
  '_': '该 | 洞 | 穴 | 坐 | 落 | 在 | 麦 | 加 | m e c c a | 北 | 部 | 的 | 一 | 座 | 山 | 顶 | 上 | 与 | 外 | 界 | 完 | 全 | 隔 | 绝 |',
  'num_samples': 127680,
  'gender': 'MALE'},
 {'id': 1739,
  'file_name': '3992172496046120193.wav',
  'raw_transcription': '该洞穴坐落在麦加 (Mecca) 北部的一座山顶上,与外界完全隔绝。',
  'transcription': '该 洞 穴 坐 落 在 麦 加 mecca 北 部 的 一 座 山 顶 上 与 外 界 完 全 隔 绝',
  '_': '该 | 洞 | 穴 | 坐 | 落 | 在 | 麦 | 加 | m e c c a | 北 | 部 | 的 | 一 | 座 | 山 | 顶 | 上 | 与 | 外 | 界 | 完 | 全 | 隔 | 绝 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 1918,
  'file_name': '7512826577185357626.wav',
  'raw_transcription': '孙德尔本斯 (Sundarbans) 已经被联合国教科文组织宣布为世界遗产。印度境内的这部分森林被称为孙德尔本斯国家公园。',
  'transcription': '孙 德 尔 本 斯 sundarbans 已 经 被 联 合 国 教 科 文 组 织 宣 布 为 世 界 遗 产 印 度 境 内 的 这 部 分 森 林 被 称 为 孙 德 尔 本 斯 国 家 公 园',
  '_': '孙 | 德 | 尔 | 本 | 斯 | s u n d a r b a n s | 已 | 经 | 被 | 联 | 合 | 国 | 教 | 科 | 文 | 组 | 织 | 宣 | 布 | 为 | 世 | 界 | 遗 | 产 | 印 | 度 | 境 | 内 | 的 | 这 | 部 | 分 | 森 | 林 | 被 | 称 | 为 | 孙 | 德 | 尔 | 本 | 斯 | 国 | 家 | 公 | 园 |',
  'num_samples': 216000,
  'gender': 'MALE'},
 {'id': 1918,
  'file_name': '3205749300836914903.wav',
  'raw_transcription': '孙德尔本斯 (Sundarbans) 已经被联合国教科文组织宣布为世界遗产。印度境内的这部分森林被称为孙德尔本斯国家公园。',
  'transcription': '孙 德 尔 本 斯 sundarbans 已 经 被 联 合 国 教 科 文 组 织 宣 布 为 世 界 遗 产 印 度 境 内 的 这 部 分 森 林 被 称 为 孙 德 尔 本 斯 国 家 公 园',
  '_': '孙 | 德 | 尔 | 本 | 斯 | s u n d a r b a n s | 已 | 经 | 被 | 联 | 合 | 国 | 教 | 科 | 文 | 组 | 织 | 宣 | 布 | 为 | 世 | 界 | 遗 | 产 | 印 | 度 | 境 | 内 | 的 | 这 | 部 | 分 | 森 | 林 | 被 | 称 | 为 | 孙 | 德 | 尔 | 本 | 斯 | 国 | 家 | 公 | 园 |',
  'num_samples': 192960,
  'gender': 'MALE'},
 {'id': 1816,
  'file_name': '10800216992470799626.wav',
  'raw_transcription': '杜瓦尔已婚,有两个已经成年的孩子,他并没有给故事的讲述者米勒留下太大印象。',
  'transcription': '杜 瓦 尔 已 婚 有 两 个 已 经 成 年 的 孩 子 他 并 没 有 给 故 事 的 讲 述 者 米 勒 留 下 太 大 印 象',
  '_': '杜 | 瓦 | 尔 | 已 | 婚 | 有 | 两 | 个 | 已 | 经 | 成 | 年 | 的 | 孩 | 子 | 他 | 并 | 没 | 有 | 给 | 故 | 事 | 的 | 讲 | 述 | 者 | 米 | 勒 | 留 | 下 | 太 | 大 | 印 | 象 |',
  'num_samples': 168960,
  'gender': 'MALE'},
 {'id': 1816,
  'file_name': '9372026808548766905.wav',
  'raw_transcription': '杜瓦尔已婚,有两个已经成年的孩子,他并没有给故事的讲述者米勒留下太大印象。',
  'transcription': '杜 瓦 尔 已 婚 有 两 个 已 经 成 年 的 孩 子 他 并 没 有 给 故 事 的 讲 述 者 米 勒 留 下 太 大 印 象',
  '_': '杜 | 瓦 | 尔 | 已 | 婚 | 有 | 两 | 个 | 已 | 经 | 成 | 年 | 的 | 孩 | 子 | 他 | 并 | 没 | 有 | 给 | 故 | 事 | 的 | 讲 | 述 | 者 | 米 | 勒 | 留 | 下 | 太 | 大 | 印 | 象 |',
  'num_samples': 228480,
  'gender': 'MALE'},
 {'id': 1816,
  'file_name': '6192640831660254496.wav',
  'raw_transcription': '杜瓦尔已婚,有两个已经成年的孩子,他并没有给故事的讲述者米勒留下太大印象。',
  'transcription': '杜 瓦 尔 已 婚 有 两 个 已 经 成 年 的 孩 子 他 并 没 有 给 故 事 的 讲 述 者 米 勒 留 下 太 大 印 象',
  '_': '杜 | 瓦 | 尔 | 已 | 婚 | 有 | 两 | 个 | 已 | 经 | 成 | 年 | 的 | 孩 | 子 | 他 | 并 | 没 | 有 | 给 | 故 | 事 | 的 | 讲 | 述 | 者 | 米 | 勒 | 留 | 下 | 太 | 大 | 印 | 象 |',
  'num_samples': 172800,
  'gender': 'FEMALE'},
 {'id': 2008,
  'file_name': '2195127065625774269.wav',
  'raw_transcription': '巴厘岛会议议程中的其他议题还包括拯救世界上现存的森林,分享技术以帮助发展中国家以污染较少的方式发展。',
  'transcription': '巴 厘 岛 会 议 议 程 中 的 其 他 议 题 还 包 括 拯 救 世 界 上 现 存 的 森 林 分 享 技 术 以 帮 助 发 展 中 国 家 以 污 染 较 少 的 方 式 发 展',
  '_': '巴 | 厘 | 岛 | 会 | 议 | 议 | 程 | 中 | 的 | 其 | 他 | 议 | 题 | 还 | 包 | 括 | 拯 | 救 | 世 | 界 | 上 | 现 | 存 | 的 | 森 | 林 | 分 | 享 | 技 | 术 | 以 | 帮 | 助 | 发 | 展 | 中 | 国 | 家 | 以 | 污 | 染 | 较 | 少 | 的 | 方 | 式 | 发 | 展 |',
  'num_samples': 263680,
  'gender': 'MALE'},
 {'id': 2008,
  'file_name': '6411322251569488676.wav',
  'raw_transcription': '巴厘岛会议议程中的其他议题还包括拯救世界上现存的森林,分享技术以帮助发展中国家以污染较少的方式发展。',
  'transcription': '巴 厘 岛 会 议 议 程 中 的 其 他 议 题 还 包 括 拯 救 世 界 上 现 存 的 森 林 分 享 技 术 以 帮 助 发 展 中 国 家 以 污 染 较 少 的 方 式 发 展',
  '_': '巴 | 厘 | 岛 | 会 | 议 | 议 | 程 | 中 | 的 | 其 | 他 | 议 | 题 | 还 | 包 | 括 | 拯 | 救 | 世 | 界 | 上 | 现 | 存 | 的 | 森 | 林 | 分 | 享 | 技 | 术 | 以 | 帮 | 助 | 发 | 展 | 中 | 国 | 家 | 以 | 污 | 染 | 较 | 少 | 的 | 方 | 式 | 发 | 展 |',
  'num_samples': 156480,
  'gender': 'FEMALE'},
 {'id': 2008,
  'file_name': '15447215796746514653.wav',
  'raw_transcription': '巴厘岛会议议程中的其他议题还包括拯救世界上现存的森林,分享技术以帮助发展中国家以污染较少的方式发展。',
  'transcription': '巴 厘 岛 会 议 议 程 中 的 其 他 议 题 还 包 括 拯 救 世 界 上 现 存 的 森 林 分 享 技 术 以 帮 助 发 展 中 国 家 以 污 染 较 少 的 方 式 发 展',
  '_': '巴 | 厘 | 岛 | 会 | 议 | 议 | 程 | 中 | 的 | 其 | 他 | 议 | 题 | 还 | 包 | 括 | 拯 | 救 | 世 | 界 | 上 | 现 | 存 | 的 | 森 | 林 | 分 | 享 | 技 | 术 | 以 | 帮 | 助 | 发 | 展 | 中 | 国 | 家 | 以 | 污 | 染 | 较 | 少 | 的 | 方 | 式 | 发 | 展 |',
  'num_samples': 214080,
  'gender': 'MALE'},
 {'id': 1878,
  'file_name': '4200219162662865107.wav',
  'raw_transcription': '教会中央集权制在罗马存在了一千多年,这种权力和金钱的集中让许多人开始质疑,他们是否遵守了这一信条。',
  'transcription': '教 会 中 央 集 权 制 在 罗 马 存 在 了 一 千 多 年 这 种 权 力 和 金 钱 的 集 中 让 许 多 人 开 始 质 疑 他 们 是 否 遵 守 了 这 一 信 条',
  '_': '教 | 会 | 中 | 央 | 集 | 权 | 制 | 在 | 罗 | 马 | 存 | 在 | 了 | 一 | 千 | 多 | 年 | 这 | 种 | 权 | 力 | 和 | 金 | 钱 | 的 | 集 | 中 | 让 | 许 | 多 | 人 | 开 | 始 | 质 | 疑 | 他 | 们 | 是 | 否 | 遵 | 守 | 了 | 这 | 一 | 信 | 条 |',
  'num_samples': 172800,
  'gender': 'FEMALE'},
 {'id': 1878,
  'file_name': '9292559763039663222.wav',
  'raw_transcription': '教会中央集权制在罗马存在了一千多年,这种权力和金钱的集中让许多人开始质疑,他们是否遵守了这一信条。',
  'transcription': '教 会 中 央 集 权 制 在 罗 马 存 在 了 一 千 多 年 这 种 权 力 和 金 钱 的 集 中 让 许 多 人 开 始 质 疑 他 们 是 否 遵 守 了 这 一 信 条',
  '_': '教 | 会 | 中 | 央 | 集 | 权 | 制 | 在 | 罗 | 马 | 存 | 在 | 了 | 一 | 千 | 多 | 年 | 这 | 种 | 权 | 力 | 和 | 金 | 钱 | 的 | 集 | 中 | 让 | 许 | 多 | 人 | 开 | 始 | 质 | 疑 | 他 | 们 | 是 | 否 | 遵 | 守 | 了 | 这 | 一 | 信 | 条 |',
  'num_samples': 255040,
  'gender': 'MALE'},
 {'id': 1828,
  'file_name': '5703077574812639383.wav',
  'raw_transcription': '在互联网上搜索“应对敌对环境课程”,也许能找到提供培训的当地公司的地址。',
  'transcription': '在 互 联 网 上 搜 索 应 对 敌 对 环 境 课 程 也 许 能 找 到 提 供 培 训 的 当 地 公 司 的 地 址',
  '_': '在 | 互 | 联 | 网 | 上 | 搜 | 索 | 应 | 对 | 敌 | 对 | 环 | 境 | 课 | 程 | 也 | 许 | 能 | 找 | 到 | 提 | 供 | 培 | 训 | 的 | 当 | 地 | 公 | 司 | 的 | 地 | 址 |',
  'num_samples': 134400,
  'gender': 'FEMALE'},
 {'id': 1828,
  'file_name': '4080536192958837333.wav',
  'raw_transcription': '在互联网上搜索“应对敌对环境课程”,也许能找到提供培训的当地公司的地址。',
  'transcription': '在 互 联 网 上 搜 索 应 对 敌 对 环 境 课 程 也 许 能 找 到 提 供 培 训 的 当 地 公 司 的 地 址',
  '_': '在 | 互 | 联 | 网 | 上 | 搜 | 索 | 应 | 对 | 敌 | 对 | 环 | 境 | 课 | 程 | 也 | 许 | 能 | 找 | 到 | 提 | 供 | 培 | 训 | 的 | 当 | 地 | 公 | 司 | 的 | 地 | 址 |',
  'num_samples': 217920,
  'gender': 'MALE'},
 {'id': 1828,
  'file_name': '1612344798246289279.wav',
  'raw_transcription': '在互联网上搜索“应对敌对环境课程”,也许能找到提供培训的当地公司的地址。',
  'transcription': '在 互 联 网 上 搜 索 应 对 敌 对 环 境 课 程 也 许 能 找 到 提 供 培 训 的 当 地 公 司 的 地 址',
  '_': '在 | 互 | 联 | 网 | 上 | 搜 | 索 | 应 | 对 | 敌 | 对 | 环 | 境 | 课 | 程 | 也 | 许 | 能 | 找 | 到 | 提 | 供 | 培 | 训 | 的 | 当 | 地 | 公 | 司 | 的 | 地 | 址 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1851,
  'file_name': '15571290079410417664.wav',
  'raw_transcription': '离岸流是海浪从海滩快速回流到海中的回流,通常发生在暗礁或类似的地方。',
  'transcription': '离 岸 流 是 海 浪 从 海 滩 快 速 回 流 到 海 中 的 回 流 通 常 发 生 在 暗 礁 或 类 似 的 地 方',
  '_': '离 | 岸 | 流 | 是 | 海 | 浪 | 从 | 海 | 滩 | 快 | 速 | 回 | 流 | 到 | 海 | 中 | 的 | 回 | 流 | 通 | 常 | 发 | 生 | 在 | 暗 | 礁 | 或 | 类 | 似 | 的 | 地 | 方 |',
  'num_samples': 209920,
  'gender': 'MALE'},
 {'id': 1851,
  'file_name': '11445004469955776566.wav',
  'raw_transcription': '离岸流是海浪从海滩快速回流到海中的回流,通常发生在暗礁或类似的地方。',
  'transcription': '离 岸 流 是 海 浪 从 海 滩 快 速 回 流 到 海 中 的 回 流 通 常 发 生 在 暗 礁 或 类 似 的 地 方',
  '_': '离 | 岸 | 流 | 是 | 海 | 浪 | 从 | 海 | 滩 | 快 | 速 | 回 | 流 | 到 | 海 | 中 | 的 | 回 | 流 | 通 | 常 | 发 | 生 | 在 | 暗 | 礁 | 或 | 类 | 似 | 的 | 地 | 方 |',
  'num_samples': 167040,
  'gender': 'MALE'},
 {'id': 1669,
  'file_name': '16010467194508249966.wav',
  'raw_transcription': '警察局长钱德拉·谢卡尔·索兰基说,被告人出庭时都蒙住了脸。',
  'transcription': '警 察 局 长 钱 德 拉 谢 卡 尔 索 兰 基 说 被 告 人 出 庭 时 都 蒙 住 了 脸',
  '_': '警 | 察 | 局 | 长 | 钱 | 德 | 拉 | 谢 | 卡 | 尔 | 索 | 兰 | 基 | 说 | 被 | 告 | 人 | 出 | 庭 | 时 | 都 | 蒙 | 住 | 了 | 脸 |',
  'num_samples': 92160,
  'gender': 'FEMALE'},
 {'id': 1669,
  'file_name': '13763174630354430252.wav',
  'raw_transcription': '警察局长钱德拉·谢卡尔·索兰基说,被告人出庭时都蒙住了脸。',
  'transcription': '警 察 局 长 钱 德 拉 谢 卡 尔 索 兰 基 说 被 告 人 出 庭 时 都 蒙 住 了 脸',
  '_': '警 | 察 | 局 | 长 | 钱 | 德 | 拉 | 谢 | 卡 | 尔 | 索 | 兰 | 基 | 说 | 被 | 告 | 人 | 出 | 庭 | 时 | 都 | 蒙 | 住 | 了 | 脸 |',
  'num_samples': 109440,
  'gender': 'FEMALE'},
 {'id': 1781,
  'file_name': '14430198265817160496.wav',
  'raw_transcription': '马达加斯加是目前为止最大的岛屿,对野生动物来说还是一片独立的大陆。',
  'transcription': '马 达 加 斯 加 是 目 前 为 止 最 大 的 岛 屿 对 野 生 动 物 来 说 还 是 一 片 独 立 的 大 陆',
  '_': '马 | 达 | 加 | 斯 | 加 | 是 | 目 | 前 | 为 | 止 | 最 | 大 | 的 | 岛 | 屿 | 对 | 野 | 生 | 动 | 物 | 来 | 说 | 还 | 是 | 一 | 片 | 独 | 立 | 的 | 大 | 陆 |',
  'num_samples': 222720,
  'gender': 'MALE'},
 {'id': 1781,
  'file_name': '15683747386292036464.wav',
  'raw_transcription': '马达加斯加是目前为止最大的岛屿,对野生动物来说还是一片独立的大陆。',
  'transcription': '马 达 加 斯 加 是 目 前 为 止 最 大 的 岛 屿 对 野 生 动 物 来 说 还 是 一 片 独 立 的 大 陆',
  '_': '马 | 达 | 加 | 斯 | 加 | 是 | 目 | 前 | 为 | 止 | 最 | 大 | 的 | 岛 | 屿 | 对 | 野 | 生 | 动 | 物 | 来 | 说 | 还 | 是 | 一 | 片 | 独 | 立 | 的 | 大 | 陆 |',
  'num_samples': 109440,
  'gender': 'FEMALE'},
 {'id': 1781,
  'file_name': '1247322206916984999.wav',
  'raw_transcription': '马达加斯加是目前为止最大的岛屿,对野生动物来说还是一片独立的大陆。',
  'transcription': '马 达 加 斯 加 是 目 前 为 止 最 大 的 岛 屿 对 野 生 动 物 来 说 还 是 一 片 独 立 的 大 陆',
  '_': '马 | 达 | 加 | 斯 | 加 | 是 | 目 | 前 | 为 | 止 | 最 | 大 | 的 | 岛 | 屿 | 对 | 野 | 生 | 动 | 物 | 来 | 说 | 还 | 是 | 一 | 片 | 独 | 立 | 的 | 大 | 陆 |',
  'num_samples': 124800,
  'gender': 'MALE'},
 {'id': 1694,
  'file_name': '5703934790809020157.wav',
  'raw_transcription': '孩子们因为各种原因被寄养,原因有被忽视、被虐待,甚至是被勒索。',
  'transcription': '孩 子 们 因 为 各 种 原 因 被 寄 养 原 因 有 被 忽 视 被 虐 待 甚 至 是 被 勒 索',
  '_': '孩 | 子 | 们 | 因 | 为 | 各 | 种 | 原 | 因 | 被 | 寄 | 养 | 原 | 因 | 有 | 被 | 忽 | 视 | 被 | 虐 | 待 | 甚 | 至 | 是 | 被 | 勒 | 索 |',
  'num_samples': 128640,
  'gender': 'MALE'},
 {'id': 1694,
  'file_name': '11827617284665517873.wav',
  'raw_transcription': '孩子们因为各种原因被寄养,原因有被忽视、被虐待,甚至是被勒索。',
  'transcription': '孩 子 们 因 为 各 种 原 因 被 寄 养 原 因 有 被 忽 视 被 虐 待 甚 至 是 被 勒 索',
  '_': '孩 | 子 | 们 | 因 | 为 | 各 | 种 | 原 | 因 | 被 | 寄 | 养 | 原 | 因 | 有 | 被 | 忽 | 视 | 被 | 虐 | 待 | 甚 | 至 | 是 | 被 | 勒 | 索 |',
  'num_samples': 188800,
  'gender': 'MALE'},
 {'id': 1694,
  'file_name': '7486932139413266764.wav',
  'raw_transcription': '孩子们因为各种原因被寄养,原因有被忽视、被虐待,甚至是被勒索。',
  'transcription': '孩 子 们 因 为 各 种 原 因 被 寄 养 原 因 有 被 忽 视 被 虐 待 甚 至 是 被 勒 索',
  '_': '孩 | 子 | 们 | 因 | 为 | 各 | 种 | 原 | 因 | 被 | 寄 | 养 | 原 | 因 | 有 | 被 | 忽 | 视 | 被 | 虐 | 待 | 甚 | 至 | 是 | 被 | 勒 | 索 |',
  'num_samples': 201600,
  'gender': 'MALE'},
 {'id': 1849,
  'file_name': '5457986910765737524.wav',
  'raw_transcription': '如果你看过电影《国家宝藏》,你可能会以为《独立宣言》背面会画着一份藏宝图。',
  'transcription': '如 果 你 看 过 电 影 国 家 宝 藏 你 可 能 会 以 为 独 立 宣 言 背 面 会 画 着 一 份 藏 宝 图',
  '_': '如 | 果 | 你 | 看 | 过 | 电 | 影 | 国 | 家 | 宝 | 藏 | 你 | 可 | 能 | 会 | 以 | 为 | 独 | 立 | 宣 | 言 | 背 | 面 | 会 | 画 | 着 | 一 | 份 | 藏 | 宝 | 图 |',
  'num_samples': 254080,
  'gender': 'MALE'},
 {'id': 1849,
  'file_name': '2292633987909823712.wav',
  'raw_transcription': '如果你看过电影《国家宝藏》,你可能会以为《独立宣言》背面会画着一份藏宝图。',
  'transcription': '如 果 你 看 过 电 影 国 家 宝 藏 你 可 能 会 以 为 独 立 宣 言 背 面 会 画 着 一 份 藏 宝 图',
  '_': '如 | 果 | 你 | 看 | 过 | 电 | 影 | 国 | 家 | 宝 | 藏 | 你 | 可 | 能 | 会 | 以 | 为 | 独 | 立 | 宣 | 言 | 背 | 面 | 会 | 画 | 着 | 一 | 份 | 藏 | 宝 | 图 |',
  'num_samples': 137280,
  'gender': 'MALE'},
 {'id': 1849,
  'file_name': '3726616410307281378.wav',
  'raw_transcription': '如果你看过电影《国家宝藏》,你可能会以为《独立宣言》背面会画着一份藏宝图。',
  'transcription': '如 果 你 看 过 电 影 国 家 宝 藏 你 可 能 会 以 为 独 立 宣 言 背 面 会 画 着 一 份 藏 宝 图',
  '_': '如 | 果 | 你 | 看 | 过 | 电 | 影 | 国 | 家 | 宝 | 藏 | 你 | 可 | 能 | 会 | 以 | 为 | 独 | 立 | 宣 | 言 | 背 | 面 | 会 | 画 | 着 | 一 | 份 | 藏 | 宝 | 图 |',
  'num_samples': 122880,
  'gender': 'FEMALE'},
 {'id': 1893,
  'file_name': '15410474364253297612.wav',
  'raw_transcription': '孙德本尔斯 (Sundarbans) 是世界上最大的滨海红树林带,林带长 80 公里(50 英里),从海岸一直延伸至孟加拉国和印度内陆。',
  'transcription': '孙 德 本 尔 斯 sundarbans 是 世 界 上 最 大 的 滨 海 红 树 林 带 林 带 长 80 公 里 50 英 里 从 海 岸 一 直 延 伸 至 孟 加 拉 国 和 印 度 内 陆',
  '_': '孙 | 德 | 本 | 尔 | 斯 | s u n d a r b a n s | 是 | 世 | 界 | 上 | 最 | 大 | 的 | 滨 | 海 | 红 | 树 | 林 | 带 | 林 | 带 | 长 | 8 0 | 公 | 里 | 5 0 | 英 | 里 | 从 | 海 | 岸 | 一 | 直 | 延 | 伸 | 至 | 孟 | 加 | 拉 | 国 | 和 | 印 | 度 | 内 | 陆 |',
  'num_samples': 305920,
  'gender': 'MALE'},
 {'id': 1893,
  'file_name': '13529926816804456938.wav',
  'raw_transcription': '孙德本尔斯 (Sundarbans) 是世界上最大的滨海红树林带,林带长 80 公里(50 英里),从海岸一直延伸至孟加拉国和印度内陆。',
  'transcription': '孙 德 本 尔 斯 sundarbans 是 世 界 上 最 大 的 滨 海 红 树 林 带 林 带 长 80 公 里 50 英 里 从 海 岸 一 直 延 伸 至 孟 加 拉 国 和 印 度 内 陆',
  '_': '孙 | 德 | 本 | 尔 | 斯 | s u n d a r b a n s | 是 | 世 | 界 | 上 | 最 | 大 | 的 | 滨 | 海 | 红 | 树 | 林 | 带 | 林 | 带 | 长 | 8 0 | 公 | 里 | 5 0 | 英 | 里 | 从 | 海 | 岸 | 一 | 直 | 延 | 伸 | 至 | 孟 | 加 | 拉 | 国 | 和 | 印 | 度 | 内 | 陆 |',
  'num_samples': 294720,
  'gender': 'MALE'},
 {'id': 1989,
  'file_name': '3253774935195728309.wav',
  'raw_transcription': '他还参与了许多国家的纸币雕版制作,近期作品包括加拿大新版 5 元和 100 元纸币正面的总理肖像。',
  'transcription': '他 还 参 与 了 许 多 国 家 的 纸 币 雕 版 制 作 近 期 作 品 包 括 加 拿 大 新 版 5 元 和 100 元 纸 币 正 面 的 总 理 肖 像',
  '_': '他 | 还 | 参 | 与 | 了 | 许 | 多 | 国 | 家 | 的 | 纸 | 币 | 雕 | 版 | 制 | 作 | 近 | 期 | 作 | 品 | 包 | 括 | 加 | 拿 | 大 | 新 | 版 | 5 | 元 | 和 | 1 0 0 | 元 | 纸 | 币 | 正 | 面 | 的 | 总 | 理 | 肖 | 像 |',
  'num_samples': 239360,
  'gender': 'MALE'},
 {'id': 1989,
  'file_name': '1055783299672050865.wav',
  'raw_transcription': '他还参与了许多国家的纸币雕版制作,近期作品包括加拿大新版 5 元和 100 元纸币正面的总理肖像。',
  'transcription': '他 还 参 与 了 许 多 国 家 的 纸 币 雕 版 制 作 近 期 作 品 包 括 加 拿 大 新 版 5 元 和 100 元 纸 币 正 面 的 总 理 肖 像',
  '_': '他 | 还 | 参 | 与 | 了 | 许 | 多 | 国 | 家 | 的 | 纸 | 币 | 雕 | 版 | 制 | 作 | 近 | 期 | 作 | 品 | 包 | 括 | 加 | 拿 | 大 | 新 | 版 | 5 | 元 | 和 | 1 0 0 | 元 | 纸 | 币 | 正 | 面 | 的 | 总 | 理 | 肖 | 像 |',
  'num_samples': 178560,
  'gender': 'MALE'},
 {'id': 1989,
  'file_name': '2979117690461608063.wav',
  'raw_transcription': '他还参与了许多国家的纸币雕版制作,近期作品包括加拿大新版 5 元和 100 元纸币正面的总理肖像。',
  'transcription': '他 还 参 与 了 许 多 国 家 的 纸 币 雕 版 制 作 近 期 作 品 包 括 加 拿 大 新 版 5 元 和 100 元 纸 币 正 面 的 总 理 肖 像',
  '_': '他 | 还 | 参 | 与 | 了 | 许 | 多 | 国 | 家 | 的 | 纸 | 币 | 雕 | 版 | 制 | 作 | 近 | 期 | 作 | 品 | 包 | 括 | 加 | 拿 | 大 | 新 | 版 | 5 | 元 | 和 | 1 0 0 | 元 | 纸 | 币 | 正 | 面 | 的 | 总 | 理 | 肖 | 像 |',
  'num_samples': 163200,
  'gender': 'FEMALE'},
 {'id': 1996,
  'file_name': '13052451262942351603.wav',
  'raw_transcription': '澳大利亚选手米切尔·古尔力获得男子站姿超级大回转比赛第十一名。捷克选手奥德里奇·耶利内克获得男子坐姿超级大回转比赛第十六名。',
  'transcription': '澳 大 利 亚 选 手 米 切 尔 古 尔 力 获 得 男 子 站 姿 超 级 大 回 转 比 赛 第 十 一 名 捷 克 选 手 奥 德 里 奇 耶 利 内 克 获 得 男 子 坐 姿 超 级 大 回 转 比 赛 第 十 六 名',
  '_': '澳 | 大 | 利 | 亚 | 选 | 手 | 米 | 切 | 尔 | 古 | 尔 | 力 | 获 | 得 | 男 | 子 | 站 | 姿 | 超 | 级 | 大 | 回 | 转 | 比 | 赛 | 第 | 十 | 一 | 名 | 捷 | 克 | 选 | 手 | 奥 | 德 | 里 | 奇 | 耶 | 利 | 内 | 克 | 获 | 得 | 男 | 子 | 坐 | 姿 | 超 | 级 | 大 | 回 | 转 | 比 | 赛 | 第 | 十 | 六 | 名 |',
  'num_samples': 230400,
  'gender': 'FEMALE'},
 {'id': 1996,
  'file_name': '13937391727051089822.wav',
  'raw_transcription': '澳大利亚选手米切尔·古尔力获得男子站姿超级大回转比赛第十一名。捷克选手奥德里奇·耶利内克获得男子坐姿超级大回转比赛第十六名。',
  'transcription': '澳 大 利 亚 选 手 米 切 尔 古 尔 力 获 得 男 子 站 姿 超 级 大 回 转 比 赛 第 十 一 名 捷 克 选 手 奥 德 里 奇 耶 利 内 克 获 得 男 子 坐 姿 超 级 大 回 转 比 赛 第 十 六 名',
  '_': '澳 | 大 | 利 | 亚 | 选 | 手 | 米 | 切 | 尔 | 古 | 尔 | 力 | 获 | 得 | 男 | 子 | 站 | 姿 | 超 | 级 | 大 | 回 | 转 | 比 | 赛 | 第 | 十 | 一 | 名 | 捷 | 克 | 选 | 手 | 奥 | 德 | 里 | 奇 | 耶 | 利 | 内 | 克 | 获 | 得 | 男 | 子 | 坐 | 姿 | 超 | 级 | 大 | 回 | 转 | 比 | 赛 | 第 | 十 | 六 | 名 |',
  'num_samples': 328320,
  'gender': 'MALE'},
 {'id': 2000,
  'file_name': '13102880023209573462.wav',
  'raw_transcription': '如果在冬天穿越北波罗的海,要检查客舱的位置,因为在冰面上航行会给那些受影响最严重的人带来非常可怕的噪音。',
  'transcription': '如 果 在 冬 天 穿 越 北 波 罗 的 海 要 检 查 客 舱 的 位 置 因 为 在 冰 面 上 航 行 会 给 那 些 受 影 响 最 严 重 的 人 带 来 非 常 可 怕 的 噪 音',
  '_': '如 | 果 | 在 | 冬 | 天 | 穿 | 越 | 北 | 波 | 罗 | 的 | 海 | 要 | 检 | 查 | 客 | 舱 | 的 | 位 | 置 | 因 | 为 | 在 | 冰 | 面 | 上 | 航 | 行 | 会 | 给 | 那 | 些 | 受 | 影 | 响 | 最 | 严 | 重 | 的 | 人 | 带 | 来 | 非 | 常 | 可 | 怕 | 的 | 噪 | 音 |',
  'num_samples': 168960,
  'gender': 'FEMALE'},
 {'id': 2000,
  'file_name': '14495336942771367734.wav',
  'raw_transcription': '如果在冬天穿越北波罗的海,要检查客舱的位置,因为在冰面上航行会给那些受影响最严重的人带来非常可怕的噪音。',
  'transcription': '如 果 在 冬 天 穿 越 北 波 罗 的 海 要 检 查 客 舱 的 位 置 因 为 在 冰 面 上 航 行 会 给 那 些 受 影 响 最 严 重 的 人 带 来 非 常 可 怕 的 噪 音',
  '_': '如 | 果 | 在 | 冬 | 天 | 穿 | 越 | 北 | 波 | 罗 | 的 | 海 | 要 | 检 | 查 | 客 | 舱 | 的 | 位 | 置 | 因 | 为 | 在 | 冰 | 面 | 上 | 航 | 行 | 会 | 给 | 那 | 些 | 受 | 影 | 响 | 最 | 严 | 重 | 的 | 人 | 带 | 来 | 非 | 常 | 可 | 怕 | 的 | 噪 | 音 |',
  'num_samples': 295040,
  'gender': 'MALE'},
 {'id': 2000,
  'file_name': '9505945782536040528.wav',
  'raw_transcription': '如果在冬天穿越北波罗的海,要检查客舱的位置,因为在冰面上航行会给那些受影响最严重的人带来非常可怕的噪音。',
  'transcription': '如 果 在 冬 天 穿 越 北 波 罗 的 海 要 检 查 客 舱 的 位 置 因 为 在 冰 面 上 航 行 会 给 那 些 受 影 响 最 严 重 的 人 带 来 非 常 可 怕 的 噪 音',
  '_': '如 | 果 | 在 | 冬 | 天 | 穿 | 越 | 北 | 波 | 罗 | 的 | 海 | 要 | 检 | 查 | 客 | 舱 | 的 | 位 | 置 | 因 | 为 | 在 | 冰 | 面 | 上 | 航 | 行 | 会 | 给 | 那 | 些 | 受 | 影 | 响 | 最 | 严 | 重 | 的 | 人 | 带 | 来 | 非 | 常 | 可 | 怕 | 的 | 噪 | 音 |',
  'num_samples': 185280,
  'gender': 'FEMALE'},
 {'id': 1932,
  'file_name': '12683340901086983.wav',
  'raw_transcription': '表演开始五分钟后,刮起了风,约一分钟后,风速达到了 70 公里/小时……紧接着又下起了雨,雨势如此之大,像针扎一样拍打在皮肤上,随后天上下起了冰雹,惊慌失措的人群尖叫着四散奔逃。',
  'transcription': '表 演 开 始 五 分 钟 后 刮 起 了 风 约 一 分 钟 后 风 速 达 到 了 70 公 里 小 时 紧 接 着 又 下 起 了 雨 雨 势 如 此 之 大 像 针 扎 一 样 拍 打 在 皮 肤 上 随 后 天 上 下 起 了 冰 雹 惊 慌 失 措 的 人 群 尖 叫 着 四 散 奔 逃',
  '_': '表 | 演 | 开 | 始 | 五 | 分 | 钟 | 后 | 刮 | 起 | 了 | 风 | 约 | 一 | 分 | 钟 | 后 | 风 | 速 | 达 | 到 | 了 | 7 0 | 公 | 里 | 小 | 时 | 紧 | 接 | 着 | 又 | 下 | 起 | 了 | 雨 | 雨 | 势 | 如 | 此 | 之 | 大 | 像 | 针 | 扎 | 一 | 样 | 拍 | 打 | 在 | 皮 | 肤 | 上 | 随 | 后 | 天 | 上 | 下 | 起 | 了 | 冰 | 雹 | 惊 | 慌 | 失 | 措 | 的 | 人 | 群 | 尖 | 叫 | 着 | 四 | 散 | 奔 | 逃 |',
  'num_samples': 373440,
  'gender': 'MALE'},
 {'id': 1932,
  'file_name': '13037894084917440449.wav',
  'raw_transcription': '表演开始五分钟后,刮起了风,约一分钟后,风速达到了 70 公里/小时……紧接着又下起了雨,雨势如此之大,像针扎一样拍打在皮肤上,随后天上下起了冰雹,惊慌失措的人群尖叫着四散奔逃。',
  'transcription': '表 演 开 始 五 分 钟 后 刮 起 了 风 约 一 分 钟 后 风 速 达 到 了 70 公 里 小 时 紧 接 着 又 下 起 了 雨 雨 势 如 此 之 大 像 针 扎 一 样 拍 打 在 皮 肤 上 随 后 天 上 下 起 了 冰 雹 惊 慌 失 措 的 人 群 尖 叫 着 四 散 奔 逃',
  '_': '表 | 演 | 开 | 始 | 五 | 分 | 钟 | 后 | 刮 | 起 | 了 | 风 | 约 | 一 | 分 | 钟 | 后 | 风 | 速 | 达 | 到 | 了 | 7 0 | 公 | 里 | 小 | 时 | 紧 | 接 | 着 | 又 | 下 | 起 | 了 | 雨 | 雨 | 势 | 如 | 此 | 之 | 大 | 像 | 针 | 扎 | 一 | 样 | 拍 | 打 | 在 | 皮 | 肤 | 上 | 随 | 后 | 天 | 上 | 下 | 起 | 了 | 冰 | 雹 | 惊 | 慌 | 失 | 措 | 的 | 人 | 群 | 尖 | 叫 | 着 | 四 | 散 | 奔 | 逃 |',
  'num_samples': 314880,
  'gender': 'MALE'},
 {'id': 1932,
  'file_name': '12263293608573146837.wav',
  'raw_transcription': '表演开始五分钟后,刮起了风,约一分钟后,风速达到了 70 公里/小时……紧接着又下起了雨,雨势如此之大,像针扎一样拍打在皮肤上,随后天上下起了冰雹,惊慌失措的人群尖叫着四散奔逃。',
  'transcription': '表 演 开 始 五 分 钟 后 刮 起 了 风 约 一 分 钟 后 风 速 达 到 了 70 公 里 小 时 紧 接 着 又 下 起 了 雨 雨 势 如 此 之 大 像 针 扎 一 样 拍 打 在 皮 肤 上 随 后 天 上 下 起 了 冰 雹 惊 慌 失 措 的 人 群 尖 叫 着 四 散 奔 逃',
  '_': '表 | 演 | 开 | 始 | 五 | 分 | 钟 | 后 | 刮 | 起 | 了 | 风 | 约 | 一 | 分 | 钟 | 后 | 风 | 速 | 达 | 到 | 了 | 7 0 | 公 | 里 | 小 | 时 | 紧 | 接 | 着 | 又 | 下 | 起 | 了 | 雨 | 雨 | 势 | 如 | 此 | 之 | 大 | 像 | 针 | 扎 | 一 | 样 | 拍 | 打 | 在 | 皮 | 肤 | 上 | 随 | 后 | 天 | 上 | 下 | 起 | 了 | 冰 | 雹 | 惊 | 慌 | 失 | 措 | 的 | 人 | 群 | 尖 | 叫 | 着 | 四 | 散 | 奔 | 逃 |',
  'num_samples': 365760,
  'gender': 'MALE'},
 {'id': 1993,
  'file_name': '9839934036118569221.wav',
  'raw_transcription': '亚热带风暴杰瑞 (Jerry) 今天在大西洋形成,这是大西洋飓风季节中第十个被命名的风暴。',
  'transcription': '亚 热 带 风 暴 杰 瑞 jerry 今 天 在 大 西 洋 形 成 这 是 大 西 洋 飓 风 季 节 中 第 十 个 被 命 名 的 风 暴',
  '_': '亚 | 热 | 带 | 风 | 暴 | 杰 | 瑞 | j e r r y | 今 | 天 | 在 | 大 | 西 | 洋 | 形 | 成 | 这 | 是 | 大 | 西 | 洋 | 飓 | 风 | 季 | 节 | 中 | 第 | 十 | 个 | 被 | 命 | 名 | 的 | 风 | 暴 |',
  'num_samples': 240000,
  'gender': 'MALE'},
 {'id': 1993,
  'file_name': '7967145515566592128.wav',
  'raw_transcription': '亚热带风暴杰瑞 (Jerry) 今天在大西洋形成,这是大西洋飓风季节中第十个被命名的风暴。',
  'transcription': '亚 热 带 风 暴 杰 瑞 jerry 今 天 在 大 西 洋 形 成 这 是 大 西 洋 飓 风 季 节 中 第 十 个 被 命 名 的 风 暴',
  '_': '亚 | 热 | 带 | 风 | 暴 | 杰 | 瑞 | j e r r y | 今 | 天 | 在 | 大 | 西 | 洋 | 形 | 成 | 这 | 是 | 大 | 西 | 洋 | 飓 | 风 | 季 | 节 | 中 | 第 | 十 | 个 | 被 | 命 | 名 | 的 | 风 | 暴 |',
  'num_samples': 136320,
  'gender': 'FEMALE'},
 {'id': 1796,
  'file_name': '16207012952553971125.wav',
  'raw_transcription': '这种沉积物是形成沙洲和海滩的必要条件,而沙洲和海滩是野生动物的栖息地。',
  'transcription': '这 种 沉 积 物 是 形 成 沙 洲 和 海 滩 的 必 要 条 件 而 沙 洲 和 海 滩 是 野 生 动 物 的 栖 息 地',
  '_': '这 | 种 | 沉 | 积 | 物 | 是 | 形 | 成 | 沙 | 洲 | 和 | 海 | 滩 | 的 | 必 | 要 | 条 | 件 | 而 | 沙 | 洲 | 和 | 海 | 滩 | 是 | 野 | 生 | 动 | 物 | 的 | 栖 | 息 | 地 |',
  'num_samples': 208960,
  'gender': 'MALE'},
 {'id': 1796,
  'file_name': '4690362788921852261.wav',
  'raw_transcription': '这种沉积物是形成沙洲和海滩的必要条件,而沙洲和海滩是野生动物的栖息地。',
  'transcription': '这 种 沉 积 物 是 形 成 沙 洲 和 海 滩 的 必 要 条 件 而 沙 洲 和 海 滩 是 野 生 动 物 的 栖 息 地',
  '_': '这 | 种 | 沉 | 积 | 物 | 是 | 形 | 成 | 沙 | 洲 | 和 | 海 | 滩 | 的 | 必 | 要 | 条 | 件 | 而 | 沙 | 洲 | 和 | 海 | 滩 | 是 | 野 | 生 | 动 | 物 | 的 | 栖 | 息 | 地 |',
  'num_samples': 200960,
  'gender': 'MALE'},
 {'id': 1796,
  'file_name': '12753643916718343813.wav',
  'raw_transcription': '这种沉积物是形成沙洲和海滩的必要条件,而沙洲和海滩是野生动物的栖息地。',
  'transcription': '这 种 沉 积 物 是 形 成 沙 洲 和 海 滩 的 必 要 条 件 而 沙 洲 和 海 滩 是 野 生 动 物 的 栖 息 地',
  '_': '这 | 种 | 沉 | 积 | 物 | 是 | 形 | 成 | 沙 | 洲 | 和 | 海 | 滩 | 的 | 必 | 要 | 条 | 件 | 而 | 沙 | 洲 | 和 | 海 | 滩 | 是 | 野 | 生 | 动 | 物 | 的 | 栖 | 息 | 地 |',
  'num_samples': 110400,
  'gender': 'FEMALE'},
 {'id': 1802,
  'file_name': '6636217929070970711.wav',
  'raw_transcription': '互联网结合了大众传播和人际传播的要素。',
  'transcription': '互 联 网 结 合 了 大 众 传 播 和 人 际 传 播 的 要 素',
  '_': '互 | 联 | 网 | 结 | 合 | 了 | 大 | 众 | 传 | 播 | 和 | 人 | 际 | 传 | 播 | 的 | 要 | 素 |',
  'num_samples': 82560,
  'gender': 'FEMALE'},
 {'id': 1802,
  'file_name': '10785184604222814212.wav',
  'raw_transcription': '互联网结合了大众传播和人际传播的要素。',
  'transcription': '互 联 网 结 合 了 大 众 传 播 和 人 际 传 播 的 要 素',
  '_': '互 | 联 | 网 | 结 | 合 | 了 | 大 | 众 | 传 | 播 | 和 | 人 | 际 | 传 | 播 | 的 | 要 | 素 |',
  'num_samples': 164160,
  'gender': 'MALE'},
 {'id': 1802,
  'file_name': '5479411876618006152.wav',
  'raw_transcription': '互联网结合了大众传播和人际传播的要素。',
  'transcription': '互 联 网 结 合 了 大 众 传 播 和 人 际 传 播 的 要 素',
  '_': '互 | 联 | 网 | 结 | 合 | 了 | 大 | 众 | 传 | 播 | 和 | 人 | 际 | 传 | 播 | 的 | 要 | 素 |',
  'num_samples': 76800,
  'gender': 'FEMALE'},
 {'id': 1934,
  'file_name': '15800442312905448333.wav',
  'raw_transcription': '平时你总能在这里听到游客和小摊贩的声音。声光交织,就像在讲述一个动人的故事。',
  'transcription': '平 时 你 总 能 在 这 里 听 到 游 客 和 小 摊 贩 的 声 音 声 光 交 织 就 像 在 讲 述 一 个 动 人 的 故 事',
  '_': '平 | 时 | 你 | 总 | 能 | 在 | 这 | 里 | 听 | 到 | 游 | 客 | 和 | 小 | 摊 | 贩 | 的 | 声 | 音 | 声 | 光 | 交 | 织 | 就 | 像 | 在 | 讲 | 述 | 一 | 个 | 动 | 人 | 的 | 故 | 事 |',
  'num_samples': 232960,
  'gender': 'MALE'},
 {'id': 1934,
  'file_name': '266483793254469093.wav',
  'raw_transcription': '平时你总能在这里听到游客和小摊贩的声音。声光交织,就像在讲述一个动人的故事。',
  'transcription': '平 时 你 总 能 在 这 里 听 到 游 客 和 小 摊 贩 的 声 音 声 光 交 织 就 像 在 讲 述 一 个 动 人 的 故 事',
  '_': '平 | 时 | 你 | 总 | 能 | 在 | 这 | 里 | 听 | 到 | 游 | 客 | 和 | 小 | 摊 | 贩 | 的 | 声 | 音 | 声 | 光 | 交 | 织 | 就 | 像 | 在 | 讲 | 述 | 一 | 个 | 动 | 人 | 的 | 故 | 事 |',
  'num_samples': 164480,
  'gender': 'MALE'},
 {'id': 1934,
  'file_name': '11602864020436549928.wav',
  'raw_transcription': '平时你总能在这里听到游客和小摊贩的声音。声光交织,就像在讲述一个动人的故事。',
  'transcription': '平 时 你 总 能 在 这 里 听 到 游 客 和 小 摊 贩 的 声 音 声 光 交 织 就 像 在 讲 述 一 个 动 人 的 故 事',
  '_': '平 | 时 | 你 | 总 | 能 | 在 | 这 | 里 | 听 | 到 | 游 | 客 | 和 | 小 | 摊 | 贩 | 的 | 声 | 音 | 声 | 光 | 交 | 织 | 就 | 像 | 在 | 讲 | 述 | 一 | 个 | 动 | 人 | 的 | 故 | 事 |',
  'num_samples': 159360,
  'gender': 'MALE'},
 {'id': 1741,
  'file_name': '13503204199376428824.wav',
  'raw_transcription': '再往北的广袤地区人烟稀少,有些地方是杳无人烟的荒野。',
  'transcription': '再 往 北 的 广 袤 地 区 人 烟 稀 少 有 些 地 方 是 杳 无 人 烟 的 荒 野',
  '_': '再 | 往 | 北 | 的 | 广 | 袤 | 地 | 区 | 人 | 烟 | 稀 | 少 | 有 | 些 | 地 | 方 | 是 | 杳 | 无 | 人 | 烟 | 的 | 荒 | 野 |',
  'num_samples': 138240,
  'gender': 'MALE'},
 {'id': 1741,
  'file_name': '16069558065169677182.wav',
  'raw_transcription': '再往北的广袤地区人烟稀少,有些地方是杳无人烟的荒野。',
  'transcription': '再 往 北 的 广 袤 地 区 人 烟 稀 少 有 些 地 方 是 杳 无 人 烟 的 荒 野',
  '_': '再 | 往 | 北 | 的 | 广 | 袤 | 地 | 区 | 人 | 烟 | 稀 | 少 | 有 | 些 | 地 | 方 | 是 | 杳 | 无 | 人 | 烟 | 的 | 荒 | 野 |',
  'num_samples': 97920,
  'gender': 'FEMALE'},
 {'id': 1741,
  'file_name': '15081556369462836272.wav',
  'raw_transcription': '再往北的广袤地区人烟稀少,有些地方是杳无人烟的荒野。',
  'transcription': '再 往 北 的 广 袤 地 区 人 烟 稀 少 有 些 地 方 是 杳 无 人 烟 的 荒 野',
  '_': '再 | 往 | 北 | 的 | 广 | 袤 | 地 | 区 | 人 | 烟 | 稀 | 少 | 有 | 些 | 地 | 方 | 是 | 杳 | 无 | 人 | 烟 | 的 | 荒 | 野 |',
  'num_samples': 172480,
  'gender': 'MALE'},
 {'id': 1728,
  'file_name': '7555132556082055383.wav',
  'raw_transcription': '卷心菜汁的颜色将根据化学物质的酸碱性发生变化。',
  'transcription': '卷 心 菜 汁 的 颜 色 将 根 据 化 学 物 质 的 酸 碱 性 发 生 变 化',
  '_': '卷 | 心 | 菜 | 汁 | 的 | 颜 | 色 | 将 | 根 | 据 | 化 | 学 | 物 | 质 | 的 | 酸 | 碱 | 性 | 发 | 生 | 变 | 化 |',
  'num_samples': 115200,
  'gender': 'MALE'},
 {'id': 1728,
  'file_name': '11752618333877605572.wav',
  'raw_transcription': '卷心菜汁的颜色将根据化学物质的酸碱性发生变化。',
  'transcription': '卷 心 菜 汁 的 颜 色 将 根 据 化 学 物 质 的 酸 碱 性 发 生 变 化',
  '_': '卷 | 心 | 菜 | 汁 | 的 | 颜 | 色 | 将 | 根 | 据 | 化 | 学 | 物 | 质 | 的 | 酸 | 碱 | 性 | 发 | 生 | 变 | 化 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 1728,
  'file_name': '11027229860710500775.wav',
  'raw_transcription': '卷心菜汁的颜色将根据化学物质的酸碱性发生变化。',
  'transcription': '卷 心 菜 汁 的 颜 色 将 根 据 化 学 物 质 的 酸 碱 性 发 生 变 化',
  '_': '卷 | 心 | 菜 | 汁 | 的 | 颜 | 色 | 将 | 根 | 据 | 化 | 学 | 物 | 质 | 的 | 酸 | 碱 | 性 | 发 | 生 | 变 | 化 |',
  'num_samples': 83520,
  'gender': 'FEMALE'},
 {'id': 1914,
  'file_name': '10702444759150940582.wav',
  'raw_transcription': '二十世纪的研究表明,基因变异有两种库:显性和隐性。',
  'transcription': '二 十 世 纪 的 研 究 表 明 基 因 变 异 有 两 种 库 显 性 和 隐 性',
  '_': '二 | 十 | 世 | 纪 | 的 | 研 | 究 | 表 | 明 | 基 | 因 | 变 | 异 | 有 | 两 | 种 | 库 | 显 | 性 | 和 | 隐 | 性 |',
  'num_samples': 114240,
  'gender': 'MALE'},
 {'id': 1914,
  'file_name': '4802653939067333698.wav',
  'raw_transcription': '二十世纪的研究表明,基因变异有两种库:显性和隐性。',
  'transcription': '二 十 世 纪 的 研 究 表 明 基 因 变 异 有 两 种 库 显 性 和 隐 性',
  '_': '二 | 十 | 世 | 纪 | 的 | 研 | 究 | 表 | 明 | 基 | 因 | 变 | 异 | 有 | 两 | 种 | 库 | 显 | 性 | 和 | 隐 | 性 |',
  'num_samples': 146880,
  'gender': 'MALE'},
 {'id': 1914,
  'file_name': '3121319265579551478.wav',
  'raw_transcription': '二十世纪的研究表明,基因变异有两种库:显性和隐性。',
  'transcription': '二 十 世 纪 的 研 究 表 明 基 因 变 异 有 两 种 库 显 性 和 隐 性',
  '_': '二 | 十 | 世 | 纪 | 的 | 研 | 究 | 表 | 明 | 基 | 因 | 变 | 异 | 有 | 两 | 种 | 库 | 显 | 性 | 和 | 隐 | 性 |',
  'num_samples': 93120,
  'gender': 'FEMALE'},
 {'id': 1681,
  'file_name': '14066003160545361452.wav',
  'raw_transcription': '实验是一种用来消除一个或多个可能性假设的试验,不过,实验并不是唯一的方法。提出问题及进行观察也可以指导科学研究。',
  'transcription': '实 验 是 一 种 用 来 消 除 一 个 或 多 个 可 能 性 假 设 的 试 验 不 过 实 验 并 不 是 唯 一 的 方 法 提 出 问 题 及 进 行 观 察 也 可 以 指 导 科 学 研 究',
  '_': '实 | 验 | 是 | 一 | 种 | 用 | 来 | 消 | 除 | 一 | 个 | 或 | 多 | 个 | 可 | 能 | 性 | 假 | 设 | 的 | 试 | 验 | 不 | 过 | 实 | 验 | 并 | 不 | 是 | 唯 | 一 | 的 | 方 | 法 | 提 | 出 | 问 | 题 | 及 | 进 | 行 | 观 | 察 | 也 | 可 | 以 | 指 | 导 | 科 | 学 | 研 | 究 |',
  'num_samples': 213120,
  'gender': 'FEMALE'},
 {'id': 1681,
  'file_name': '17007874517292352300.wav',
  'raw_transcription': '实验是一种用来消除一个或多个可能性假设的试验,不过,实验并不是唯一的方法。提出问题及进行观察也可以指导科学研究。',
  'transcription': '实 验 是 一 种 用 来 消 除 一 个 或 多 个 可 能 性 假 设 的 试 验 不 过 实 验 并 不 是 唯 一 的 方 法 提 出 问 题 及 进 行 观 察 也 可 以 指 导 科 学 研 究',
  '_': '实 | 验 | 是 | 一 | 种 | 用 | 来 | 消 | 除 | 一 | 个 | 或 | 多 | 个 | 可 | 能 | 性 | 假 | 设 | 的 | 试 | 验 | 不 | 过 | 实 | 验 | 并 | 不 | 是 | 唯 | 一 | 的 | 方 | 法 | 提 | 出 | 问 | 题 | 及 | 进 | 行 | 观 | 察 | 也 | 可 | 以 | 指 | 导 | 科 | 学 | 研 | 究 |',
  'num_samples': 381760,
  'gender': 'MALE'},
 {'id': 1681,
  'file_name': '5533825858416549956.wav',
  'raw_transcription': '实验是一种用来消除一个或多个可能性假设的试验,不过,实验并不是唯一的方法。提出问题及进行观察也可以指导科学研究。',
  'transcription': '实 验 是 一 种 用 来 消 除 一 个 或 多 个 可 能 性 假 设 的 试 验 不 过 实 验 并 不 是 唯 一 的 方 法 提 出 问 题 及 进 行 观 察 也 可 以 指 导 科 学 研 究',
  '_': '实 | 验 | 是 | 一 | 种 | 用 | 来 | 消 | 除 | 一 | 个 | 或 | 多 | 个 | 可 | 能 | 性 | 假 | 设 | 的 | 试 | 验 | 不 | 过 | 实 | 验 | 并 | 不 | 是 | 唯 | 一 | 的 | 方 | 法 | 提 | 出 | 问 | 题 | 及 | 进 | 行 | 观 | 察 | 也 | 可 | 以 | 指 | 导 | 科 | 学 | 研 | 究 |',
  'num_samples': 318720,
  'gender': 'MALE'},
 {'id': 1695,
  'file_name': '7584839622746771875.wav',
  'raw_transcription': 'Pa amb Oli 是一种在夏天尤为流行的简单晚餐:面包搭配橄榄油、番茄,手头上任何佐料都可加入,比如奶酪、金枪鱼等。',
  'transcription': 'pa amb oli 是 一 种 在 夏 天 尤 为 流 行 的 简 单 晚 餐 面 包 搭 配 橄 榄 油 番 茄 手 头 上 任 何 佐 料 都 可 加 入 比 如 奶 酪 金 枪 鱼 等',
  '_': 'p a | a m b | o l i | 是 | 一 | 种 | 在 | 夏 | 天 | 尤 | 为 | 流 | 行 | 的 | 简 | 单 | 晚 | 餐 | 面 | 包 | 搭 | 配 | 橄 | 榄 | 油 | 番 | 茄 | 手 | 头 | 上 | 任 | 何 | 佐 | 料 | 都 | 可 | 加 | 入 | 比 | 如 | 奶 | 酪 | 金 | 枪 | 鱼 | 等 |',
  'num_samples': 253120,
  'gender': 'MALE'},
 {'id': 1695,
  'file_name': '12472899299695985973.wav',
  'raw_transcription': 'Pa amb Oli 是一种在夏天尤为流行的简单晚餐:面包搭配橄榄油、番茄,手头上任何佐料都可加入,比如奶酪、金枪鱼等。',
  'transcription': 'pa amb oli 是 一 种 在 夏 天 尤 为 流 行 的 简 单 晚 餐 面 包 搭 配 橄 榄 油 番 茄 手 头 上 任 何 佐 料 都 可 加 入 比 如 奶 酪 金 枪 鱼 等',
  '_': 'p a | a m b | o l i | 是 | 一 | 种 | 在 | 夏 | 天 | 尤 | 为 | 流 | 行 | 的 | 简 | 单 | 晚 | 餐 | 面 | 包 | 搭 | 配 | 橄 | 榄 | 油 | 番 | 茄 | 手 | 头 | 上 | 任 | 何 | 佐 | 料 | 都 | 可 | 加 | 入 | 比 | 如 | 奶 | 酪 | 金 | 枪 | 鱼 | 等 |',
  'num_samples': 212160,
  'gender': 'FEMALE'},
 {'id': 1850,
  'file_name': '18433902447861485379.wav',
  'raw_transcription': '它能向后兼容 802.11a、802.11b 和 802.11g,前提是基站要有双无线电。',
  'transcription': '它 能 向 后 兼 容 802.11a 802.11b 和 802.11g 前 提 是 基 站 要 有 双 无 线 电',
  '_': '它 | 能 | 向 | 后 | 兼 | 容 | 8 0 2 . 1 1 a | 8 0 2 . 1 1 b | 和 | 8 0 2 . 1 1 g | 前 | 提 | 是 | 基 | 站 | 要 | 有 | 双 | 无 | 线 | 电 |',
  'num_samples': 248960,
  'gender': 'MALE'},
 {'id': 1850,
  'file_name': '388460991317794418.wav',
  'raw_transcription': '它能向后兼容 802.11a、802.11b 和 802.11g,前提是基站要有双无线电。',
  'transcription': '它 能 向 后 兼 容 802.11a 802.11b 和 802.11g 前 提 是 基 站 要 有 双 无 线 电',
  '_': '它 | 能 | 向 | 后 | 兼 | 容 | 8 0 2 . 1 1 a | 8 0 2 . 1 1 b | 和 | 8 0 2 . 1 1 g | 前 | 提 | 是 | 基 | 站 | 要 | 有 | 双 | 无 | 线 | 电 |',
  'num_samples': 160320,
  'gender': 'FEMALE'},
 {'id': 1850,
  'file_name': '9699581877784184472.wav',
  'raw_transcription': '它能向后兼容 802.11a、802.11b 和 802.11g,前提是基站要有双无线电。',
  'transcription': '它 能 向 后 兼 容 802.11a 802.11b 和 802.11g 前 提 是 基 站 要 有 双 无 线 电',
  '_': '它 | 能 | 向 | 后 | 兼 | 容 | 8 0 2 . 1 1 a | 8 0 2 . 1 1 b | 和 | 8 0 2 . 1 1 g | 前 | 提 | 是 | 基 | 站 | 要 | 有 | 双 | 无 | 线 | 电 |',
  'num_samples': 154560,
  'gender': 'FEMALE'},
 {'id': 1942,
  'file_name': '6624289270206205561.wav',
  'raw_transcription': '我们用植物做房子,用植物做衣服。我们吃的大部分食物都是植物。没有植物,动物就不能生存。',
  'transcription': '我 们 用 植 物 做 房 子 用 植 物 做 衣 服 我 们 吃 的 大 部 分 食 物 都 是 植 物 没 有 植 物 动 物 就 不 能 生 存',
  '_': '我 | 们 | 用 | 植 | 物 | 做 | 房 | 子 | 用 | 植 | 物 | 做 | 衣 | 服 | 我 | 们 | 吃 | 的 | 大 | 部 | 分 | 食 | 物 | 都 | 是 | 植 | 物 | 没 | 有 | 植 | 物 | 动 | 物 | 就 | 不 | 能 | 生 | 存 |',
  'num_samples': 230080,
  'gender': 'MALE'},
 {'id': 1942,
  'file_name': '7628769825850243270.wav',
  'raw_transcription': '我们用植物做房子,用植物做衣服。我们吃的大部分食物都是植物。没有植物,动物就不能生存。',
  'transcription': '我 们 用 植 物 做 房 子 用 植 物 做 衣 服 我 们 吃 的 大 部 分 食 物 都 是 植 物 没 有 植 物 动 物 就 不 能 生 存',
  '_': '我 | 们 | 用 | 植 | 物 | 做 | 房 | 子 | 用 | 植 | 物 | 做 | 衣 | 服 | 我 | 们 | 吃 | 的 | 大 | 部 | 分 | 食 | 物 | 都 | 是 | 植 | 物 | 没 | 有 | 植 | 物 | 动 | 物 | 就 | 不 | 能 | 生 | 存 |',
  'num_samples': 164160,
  'gender': 'MALE'},
 {'id': 1942,
  'file_name': '2622056757307644906.wav',
  'raw_transcription': '我们用植物做房子,用植物做衣服。我们吃的大部分食物都是植物。没有植物,动物就不能生存。',
  'transcription': '我 们 用 植 物 做 房 子 用 植 物 做 衣 服 我 们 吃 的 大 部 分 食 物 都 是 植 物 没 有 植 物 动 物 就 不 能 生 存',
  '_': '我 | 们 | 用 | 植 | 物 | 做 | 房 | 子 | 用 | 植 | 物 | 做 | 衣 | 服 | 我 | 们 | 吃 | 的 | 大 | 部 | 分 | 食 | 物 | 都 | 是 | 植 | 物 | 没 | 有 | 植 | 物 | 动 | 物 | 就 | 不 | 能 | 生 | 存 |',
  'num_samples': 125760,
  'gender': 'FEMALE'},
 {'id': 1817,
  'file_name': '12537777433733171491.wav',
  'raw_transcription': '然而在这方面,申根区有点像一个国家。',
  'transcription': '然 而 在 这 方 面 申 根 区 有 点 像 一 个 国 家',
  '_': '然 | 而 | 在 | 这 | 方 | 面 | 申 | 根 | 区 | 有 | 点 | 像 | 一 | 个 | 国 | 家 |',
  'num_samples': 64320,
  'gender': 'FEMALE'},
 {'id': 1817,
  'file_name': '5814523244368617534.wav',
  'raw_transcription': '然而在这方面,申根区有点像一个国家。',
  'transcription': '然 而 在 这 方 面 申 根 区 有 点 像 一 个 国 家',
  '_': '然 | 而 | 在 | 这 | 方 | 面 | 申 | 根 | 区 | 有 | 点 | 像 | 一 | 个 | 国 | 家 |',
  'num_samples': 96960,
  'gender': 'MALE'},
 {'id': 1817,
  'file_name': '15760212349524700585.wav',
  'raw_transcription': '然而在这方面,申根区有点像一个国家。',
  'transcription': '然 而 在 这 方 面 申 根 区 有 点 像 一 个 国 家',
  '_': '然 | 而 | 在 | 这 | 方 | 面 | 申 | 根 | 区 | 有 | 点 | 像 | 一 | 个 | 国 | 家 |',
  'num_samples': 173440,
  'gender': 'MALE'},
 {'id': 1771,
  'file_name': '5235531870024636370.wav',
  'raw_transcription': '记住,虽然主舞台上的音乐可能已经结束,但节日的其他部分可能会一直演奏音乐到深夜。',
  'transcription': '记 住 虽 然 主 舞 台 上 的 音 乐 可 能 已 经 结 束 但 节 日 的 其 他 部 分 可 能 会 一 直 演 奏 音 乐 到 深 夜',
  '_': '记 | 住 | 虽 | 然 | 主 | 舞 | 台 | 上 | 的 | 音 | 乐 | 可 | 能 | 已 | 经 | 结 | 束 | 但 | 节 | 日 | 的 | 其 | 他 | 部 | 分 | 可 | 能 | 会 | 一 | 直 | 演 | 奏 | 音 | 乐 | 到 | 深 | 夜 |',
  'num_samples': 249280,
  'gender': 'MALE'},
 {'id': 1771,
  'file_name': '13643463437412774582.wav',
  'raw_transcription': '记住,虽然主舞台上的音乐可能已经结束,但节日的其他部分可能会一直演奏音乐到深夜。',
  'transcription': '记 住 虽 然 主 舞 台 上 的 音 乐 可 能 已 经 结 束 但 节 日 的 其 他 部 分 可 能 会 一 直 演 奏 音 乐 到 深 夜',
  '_': '记 | 住 | 虽 | 然 | 主 | 舞 | 台 | 上 | 的 | 音 | 乐 | 可 | 能 | 已 | 经 | 结 | 束 | 但 | 节 | 日 | 的 | 其 | 他 | 部 | 分 | 可 | 能 | 会 | 一 | 直 | 演 | 奏 | 音 | 乐 | 到 | 深 | 夜 |',
  'num_samples': 143040,
  'gender': 'FEMALE'},
 {'id': 1731,
  'file_name': '992659465919852316.wav',
  'raw_transcription': '在群岛和湖泊之中,游艇并不是必需的。',
  'transcription': '在 群 岛 和 湖 泊 之 中 游 艇 并 不 是 必 需 的',
  '_': '在 | 群 | 岛 | 和 | 湖 | 泊 | 之 | 中 | 游 | 艇 | 并 | 不 | 是 | 必 | 需 | 的 |',
  'num_samples': 105600,
  'gender': 'MALE'},
 {'id': 1731,
  'file_name': '6994117326469508396.wav',
  'raw_transcription': '在群岛和湖泊之中,游艇并不是必需的。',
  'transcription': '在 群 岛 和 湖 泊 之 中 游 艇 并 不 是 必 需 的',
  '_': '在 | 群 | 岛 | 和 | 湖 | 泊 | 之 | 中 | 游 | 艇 | 并 | 不 | 是 | 必 | 需 | 的 |',
  'num_samples': 92160,
  'gender': 'MALE'},
 {'id': 1731,
  'file_name': '15746484993381572135.wav',
  'raw_transcription': '在群岛和湖泊之中,游艇并不是必需的。',
  'transcription': '在 群 岛 和 湖 泊 之 中 游 艇 并 不 是 必 需 的',
  '_': '在 | 群 | 岛 | 和 | 湖 | 泊 | 之 | 中 | 游 | 艇 | 并 | 不 | 是 | 必 | 需 | 的 |',
  'num_samples': 86400,
  'gender': 'MALE'},
 {'id': 1825,
  'file_name': '8700616037011827170.wav',
  'raw_transcription': '如果想近距离观看演出,你得早点到,在靠近舞台的地方占好营地。',
  'transcription': '如 果 想 近 距 离 观 看 演 出 你 得 早 点 到 在 靠 近 舞 台 的 地 方 占 好 营 地',
  '_': '如 | 果 | 想 | 近 | 距 | 离 | 观 | 看 | 演 | 出 | 你 | 得 | 早 | 点 | 到 | 在 | 靠 | 近 | 舞 | 台 | 的 | 地 | 方 | 占 | 好 | 营 | 地 |',
  'num_samples': 187200,
  'gender': 'MALE'},
 {'id': 1825,
  'file_name': '18123910082460022295.wav',
  'raw_transcription': '如果想近距离观看演出,你得早点到,在靠近舞台的地方占好营地。',
  'transcription': '如 果 想 近 距 离 观 看 演 出 你 得 早 点 到 在 靠 近 舞 台 的 地 方 占 好 营 地',
  '_': '如 | 果 | 想 | 近 | 距 | 离 | 观 | 看 | 演 | 出 | 你 | 得 | 早 | 点 | 到 | 在 | 靠 | 近 | 舞 | 台 | 的 | 地 | 方 | 占 | 好 | 营 | 地 |',
  'num_samples': 101760,
  'gender': 'FEMALE'},
 {'id': 1825,
  'file_name': '5079265307815312238.wav',
  'raw_transcription': '如果想近距离观看演出,你得早点到,在靠近舞台的地方占好营地。',
  'transcription': '如 果 想 近 距 离 观 看 演 出 你 得 早 点 到 在 靠 近 舞 台 的 地 方 占 好 营 地',
  '_': '如 | 果 | 想 | 近 | 距 | 离 | 观 | 看 | 演 | 出 | 你 | 得 | 早 | 点 | 到 | 在 | 靠 | 近 | 舞 | 台 | 的 | 地 | 方 | 占 | 好 | 营 | 地 |',
  'num_samples': 100800,
  'gender': 'FEMALE'},
 {'id': 1928,
  'file_name': '5654565011598137308.wav',
  'raw_transcription': '到 1976 年,马丘比丘的百分之三十得到修复,修复工作一直持续到今天。',
  'transcription': '到 1976 年 马 丘 比 丘 的 百 分 之 三 十 得 到 修 复 修 复 工 作 一 直 持 续 到 今 天',
  '_': '到 | 1 9 7 6 | 年 | 马 | 丘 | 比 | 丘 | 的 | 百 | 分 | 之 | 三 | 十 | 得 | 到 | 修 | 复 | 修 | 复 | 工 | 作 | 一 | 直 | 持 | 续 | 到 | 今 | 天 |',
  'num_samples': 138240,
  'gender': 'MALE'},
 {'id': 1928,
  'file_name': '3493041467829842408.wav',
  'raw_transcription': '到 1976 年,马丘比丘的百分之三十得到修复,修复工作一直持续到今天。',
  'transcription': '到 1976 年 马 丘 比 丘 的 百 分 之 三 十 得 到 修 复 修 复 工 作 一 直 持 续 到 今 天',
  '_': '到 | 1 9 7 6 | 年 | 马 | 丘 | 比 | 丘 | 的 | 百 | 分 | 之 | 三 | 十 | 得 | 到 | 修 | 复 | 修 | 复 | 工 | 作 | 一 | 直 | 持 | 续 | 到 | 今 | 天 |',
  'num_samples': 157440,
  'gender': 'MALE'},
 {'id': 1933,
  'file_name': '5939257322452725781.wav',
  'raw_transcription': '最终,有许多小型的猫科动物(包括散养的宠物猫),以昆虫、啮齿动物、蜥蜴和鸟类等数量多得多的小型猎物为食。',
  'transcription': '最 终 有 许 多 小 型 的 猫 科 动 物 包 括 散 养 的 宠 物 猫 以 昆 虫 啮 齿 动 物 蜥 蜴 和 鸟 类 等 数 量 多 得 多 的 小 型 猎 物 为 食',
  '_': '最 | 终 | 有 | 许 | 多 | 小 | 型 | 的 | 猫 | 科 | 动 | 物 | 包 | 括 | 散 | 养 | 的 | 宠 | 物 | 猫 | 以 | 昆 | 虫 | 啮 | 齿 | 动 | 物 | 蜥 | 蜴 | 和 | 鸟 | 类 | 等 | 数 | 量 | 多 | 得 | 多 | 的 | 小 | 型 | 猎 | 物 | 为 | 食 |',
  'num_samples': 288320,
  'gender': 'MALE'},
 {'id': 1933,
  'file_name': '15715568960278231151.wav',
  'raw_transcription': '最终,有许多小型的猫科动物(包括散养的宠物猫),以昆虫、啮齿动物、蜥蜴和鸟类等数量多得多的小型猎物为食。',
  'transcription': '最 终 有 许 多 小 型 的 猫 科 动 物 包 括 散 养 的 宠 物 猫 以 昆 虫 啮 齿 动 物 蜥 蜴 和 鸟 类 等 数 量 多 得 多 的 小 型 猎 物 为 食',
  '_': '最 | 终 | 有 | 许 | 多 | 小 | 型 | 的 | 猫 | 科 | 动 | 物 | 包 | 括 | 散 | 养 | 的 | 宠 | 物 | 猫 | 以 | 昆 | 虫 | 啮 | 齿 | 动 | 物 | 蜥 | 蜴 | 和 | 鸟 | 类 | 等 | 数 | 量 | 多 | 得 | 多 | 的 | 小 | 型 | 猎 | 物 | 为 | 食 |',
  'num_samples': 269760,
  'gender': 'MALE'},
 {'id': 1784,
  'file_name': '3671202098171186273.wav',
  'raw_transcription': '格陵兰岛人烟稀少。据北欧史诗萨迦记载,红胡子埃里克因犯谋杀罪被逐出冰岛,他向西航行,发现陆地,于是将其命名为格陵兰岛。',
  'transcription': '格 陵 兰 岛 人 烟 稀 少 据 北 欧 史 诗 萨 迦 记 载 红 胡 子 埃 里 克 因 犯 谋 杀 罪 被 逐 出 冰 岛 他 向 西 航 行 发 现 陆 地 于 是 将 其 命 名 为 格 陵 兰 岛',
  '_': '格 | 陵 | 兰 | 岛 | 人 | 烟 | 稀 | 少 | 据 | 北 | 欧 | 史 | 诗 | 萨 | 迦 | 记 | 载 | 红 | 胡 | 子 | 埃 | 里 | 克 | 因 | 犯 | 谋 | 杀 | 罪 | 被 | 逐 | 出 | 冰 | 岛 | 他 | 向 | 西 | 航 | 行 | 发 | 现 | 陆 | 地 | 于 | 是 | 将 | 其 | 命 | 名 | 为 | 格 | 陵 | 兰 | 岛 |',
  'num_samples': 298560,
  'gender': 'MALE'},
 {'id': 1784,
  'file_name': '16658737571813204649.wav',
  'raw_transcription': '格陵兰岛人烟稀少。据北欧史诗萨迦记载,红胡子埃里克因犯谋杀罪被逐出冰岛,他向西航行,发现陆地,于是将其命名为格陵兰岛。',
  'transcription': '格 陵 兰 岛 人 烟 稀 少 据 北 欧 史 诗 萨 迦 记 载 红 胡 子 埃 里 克 因 犯 谋 杀 罪 被 逐 出 冰 岛 他 向 西 航 行 发 现 陆 地 于 是 将 其 命 名 为 格 陵 兰 岛',
  '_': '格 | 陵 | 兰 | 岛 | 人 | 烟 | 稀 | 少 | 据 | 北 | 欧 | 史 | 诗 | 萨 | 迦 | 记 | 载 | 红 | 胡 | 子 | 埃 | 里 | 克 | 因 | 犯 | 谋 | 杀 | 罪 | 被 | 逐 | 出 | 冰 | 岛 | 他 | 向 | 西 | 航 | 行 | 发 | 现 | 陆 | 地 | 于 | 是 | 将 | 其 | 命 | 名 | 为 | 格 | 陵 | 兰 | 岛 |',
  'num_samples': 337280,
  'gender': 'MALE'},
 {'id': 1784,
  'file_name': '7888465798530719449.wav',
  'raw_transcription': '格陵兰岛人烟稀少。据北欧史诗萨迦记载,红胡子埃里克因犯谋杀罪被逐出冰岛,他向西航行,发现陆地,于是将其命名为格陵兰岛。',
  'transcription': '格 陵 兰 岛 人 烟 稀 少 据 北 欧 史 诗 萨 迦 记 载 红 胡 子 埃 里 克 因 犯 谋 杀 罪 被 逐 出 冰 岛 他 向 西 航 行 发 现 陆 地 于 是 将 其 命 名 为 格 陵 兰 岛',
  '_': '格 | 陵 | 兰 | 岛 | 人 | 烟 | 稀 | 少 | 据 | 北 | 欧 | 史 | 诗 | 萨 | 迦 | 记 | 载 | 红 | 胡 | 子 | 埃 | 里 | 克 | 因 | 犯 | 谋 | 杀 | 罪 | 被 | 逐 | 出 | 冰 | 岛 | 他 | 向 | 西 | 航 | 行 | 发 | 现 | 陆 | 地 | 于 | 是 | 将 | 其 | 命 | 名 | 为 | 格 | 陵 | 兰 | 岛 |',
  'num_samples': 234240,
  'gender': 'MALE'},
 {'id': 1931,
  'file_name': '15864687123345185401.wav',
  'raw_transcription': '该服务经常用于航运,包括游艇以及有远程数据和语音需求的探险。',
  'transcription': '该 服 务 经 常 用 于 航 运 包 括 游 艇 以 及 有 远 程 数 据 和 语 音 需 求 的 探 险',
  '_': '该 | 服 | 务 | 经 | 常 | 用 | 于 | 航 | 运 | 包 | 括 | 游 | 艇 | 以 | 及 | 有 | 远 | 程 | 数 | 据 | 和 | 语 | 音 | 需 | 求 | 的 | 探 | 险 |',
  'num_samples': 143040,
  'gender': 'MALE'},
 {'id': 1931,
  'file_name': '14959654315777841349.wav',
  'raw_transcription': '该服务经常用于航运,包括游艇以及有远程数据和语音需求的探险。',
  'transcription': '该 服 务 经 常 用 于 航 运 包 括 游 艇 以 及 有 远 程 数 据 和 语 音 需 求 的 探 险',
  '_': '该 | 服 | 务 | 经 | 常 | 用 | 于 | 航 | 运 | 包 | 括 | 游 | 艇 | 以 | 及 | 有 | 远 | 程 | 数 | 据 | 和 | 语 | 音 | 需 | 求 | 的 | 探 | 险 |',
  'num_samples': 143040,
  'gender': 'MALE'},
 {'id': 1931,
  'file_name': '13477915708028379558.wav',
  'raw_transcription': '该服务经常用于航运,包括游艇以及有远程数据和语音需求的探险。',
  'transcription': '该 服 务 经 常 用 于 航 运 包 括 游 艇 以 及 有 远 程 数 据 和 语 音 需 求 的 探 险',
  '_': '该 | 服 | 务 | 经 | 常 | 用 | 于 | 航 | 运 | 包 | 括 | 游 | 艇 | 以 | 及 | 有 | 远 | 程 | 数 | 据 | 和 | 语 | 音 | 需 | 求 | 的 | 探 | 险 |',
  'num_samples': 110400,
  'gender': 'FEMALE'},
 {'id': 1788,
  'file_name': '6649804416500045546.wav',
  'raw_transcription': '美国体操协会对美国奥委会的信函表示支持,并接受奥运会大家庭的严格要求,即为所有运动员营造一个安全的训练环境。',
  'transcription': '美 国 体 操 协 会 对 美 国 奥 委 会 的 信 函 表 示 支 持 并 接 受 奥 运 会 大 家 庭 的 严 格 要 求 即 为 所 有 运 动 员 营 造 一 个 安 全 的 训 练 环 境',
  '_': '美 | 国 | 体 | 操 | 协 | 会 | 对 | 美 | 国 | 奥 | 委 | 会 | 的 | 信 | 函 | 表 | 示 | 支 | 持 | 并 | 接 | 受 | 奥 | 运 | 会 | 大 | 家 | 庭 | 的 | 严 | 格 | 要 | 求 | 即 | 为 | 所 | 有 | 运 | 动 | 员 | 营 | 造 | 一 | 个 | 安 | 全 | 的 | 训 | 练 | 环 | 境 |',
  'num_samples': 288960,
  'gender': 'MALE'},
 {'id': 1788,
  'file_name': '559602726260755310.wav',
  'raw_transcription': '美国体操协会对美国奥委会的信函表示支持,并接受奥运会大家庭的严格要求,即为所有运动员营造一个安全的训练环境。',
  'transcription': '美 国 体 操 协 会 对 美 国 奥 委 会 的 信 函 表 示 支 持 并 接 受 奥 运 会 大 家 庭 的 严 格 要 求 即 为 所 有 运 动 员 营 造 一 个 安 全 的 训 练 环 境',
  '_': '美 | 国 | 体 | 操 | 协 | 会 | 对 | 美 | 国 | 奥 | 委 | 会 | 的 | 信 | 函 | 表 | 示 | 支 | 持 | 并 | 接 | 受 | 奥 | 运 | 会 | 大 | 家 | 庭 | 的 | 严 | 格 | 要 | 求 | 即 | 为 | 所 | 有 | 运 | 动 | 员 | 营 | 造 | 一 | 个 | 安 | 全 | 的 | 训 | 练 | 环 | 境 |',
  'num_samples': 157440,
  'gender': 'FEMALE'},
 {'id': 1788,
  'file_name': '12689859936328531860.wav',
  'raw_transcription': '美国体操协会对美国奥委会的信函表示支持,并接受奥运会大家庭的严格要求,即为所有运动员营造一个安全的训练环境。',
  'transcription': '美 国 体 操 协 会 对 美 国 奥 委 会 的 信 函 表 示 支 持 并 接 受 奥 运 会 大 家 庭 的 严 格 要 求 即 为 所 有 运 动 员 营 造 一 个 安 全 的 训 练 环 境',
  '_': '美 | 国 | 体 | 操 | 协 | 会 | 对 | 美 | 国 | 奥 | 委 | 会 | 的 | 信 | 函 | 表 | 示 | 支 | 持 | 并 | 接 | 受 | 奥 | 运 | 会 | 大 | 家 | 庭 | 的 | 严 | 格 | 要 | 求 | 即 | 为 | 所 | 有 | 运 | 动 | 员 | 营 | 造 | 一 | 个 | 安 | 全 | 的 | 训 | 练 | 环 | 境 |',
  'num_samples': 274560,
  'gender': 'MALE'},
 {'id': 1946,
  'file_name': '2262167164760496473.wav',
  'raw_transcription': '取消政策各不相同,但截至三月末,大多数由于新冠病毒而出台的取消政策并没有延长到 2020 年 7 月——原定奥运会举办时间。',
  'transcription': '取 消 政 策 各 不 相 同 但 截 至 三 月 末 大 多 数 由 于 新 冠 病 毒 而 出 台 的 取 消 政 策 并 没 有 延 长 到 2020 年 7 月 原 定 奥 运 会 举 办 时 间',
  '_': '取 | 消 | 政 | 策 | 各 | 不 | 相 | 同 | 但 | 截 | 至 | 三 | 月 | 末 | 大 | 多 | 数 | 由 | 于 | 新 | 冠 | 病 | 毒 | 而 | 出 | 台 | 的 | 取 | 消 | 政 | 策 | 并 | 没 | 有 | 延 | 长 | 到 | 2 0 2 0 | 年 | 7 | 月 | 原 | 定 | 奥 | 运 | 会 | 举 | 办 | 时 | 间 |',
  'num_samples': 183360,
  'gender': 'FEMALE'},
 {'id': 1946,
  'file_name': '4989780547355059233.wav',
  'raw_transcription': '取消政策各不相同,但截至三月末,大多数由于新冠病毒而出台的取消政策并没有延长到 2020 年 7 月——原定奥运会举办时间。',
  'transcription': '取 消 政 策 各 不 相 同 但 截 至 三 月 末 大 多 数 由 于 新 冠 病 毒 而 出 台 的 取 消 政 策 并 没 有 延 长 到 2020 年 7 月 原 定 奥 运 会 举 办 时 间',
  '_': '取 | 消 | 政 | 策 | 各 | 不 | 相 | 同 | 但 | 截 | 至 | 三 | 月 | 末 | 大 | 多 | 数 | 由 | 于 | 新 | 冠 | 病 | 毒 | 而 | 出 | 台 | 的 | 取 | 消 | 政 | 策 | 并 | 没 | 有 | 延 | 长 | 到 | 2 0 2 0 | 年 | 7 | 月 | 原 | 定 | 奥 | 运 | 会 | 举 | 办 | 时 | 间 |',
  'num_samples': 177600,
  'gender': 'FEMALE'},
 {'id': 1946,
  'file_name': '4594399919180475667.wav',
  'raw_transcription': '取消政策各不相同,但截至三月末,大多数由于新冠病毒而出台的取消政策并没有延长到 2020 年 7 月——原定奥运会举办时间。',
  'transcription': '取 消 政 策 各 不 相 同 但 截 至 三 月 末 大 多 数 由 于 新 冠 病 毒 而 出 台 的 取 消 政 策 并 没 有 延 长 到 2020 年 7 月 原 定 奥 运 会 举 办 时 间',
  '_': '取 | 消 | 政 | 策 | 各 | 不 | 相 | 同 | 但 | 截 | 至 | 三 | 月 | 末 | 大 | 多 | 数 | 由 | 于 | 新 | 冠 | 病 | 毒 | 而 | 出 | 台 | 的 | 取 | 消 | 政 | 策 | 并 | 没 | 有 | 延 | 长 | 到 | 2 0 2 0 | 年 | 7 | 月 | 原 | 定 | 奥 | 运 | 会 | 举 | 办 | 时 | 间 |',
  'num_samples': 323520,
  'gender': 'MALE'},
 {'id': 1689,
  'file_name': '14550638651919221566.wav',
  'raw_transcription': '欧洲是片面积相对较小但有着许多独立国家的大陆。在通常情况下,穿越多个国家旅行意味着必须多次经历签证申请和护照检查。',
  'transcription': '欧 洲 是 片 面 积 相 对 较 小 但 有 着 许 多 独 立 国 家 的 大 陆 在 通 常 情 况 下 穿 越 多 个 国 家 旅 行 意 味 着 必 须 多 次 经 历 签 证 申 请 和 护 照 检 查',
  '_': '欧 | 洲 | 是 | 片 | 面 | 积 | 相 | 对 | 较 | 小 | 但 | 有 | 着 | 许 | 多 | 独 | 立 | 国 | 家 | 的 | 大 | 陆 | 在 | 通 | 常 | 情 | 况 | 下 | 穿 | 越 | 多 | 个 | 国 | 家 | 旅 | 行 | 意 | 味 | 着 | 必 | 须 | 多 | 次 | 经 | 历 | 签 | 证 | 申 | 请 | 和 | 护 | 照 | 检 | 查 |',
  'num_samples': 273600,
  'gender': 'MALE'},
 {'id': 1689,
  'file_name': '15221793939485697922.wav',
  'raw_transcription': '欧洲是片面积相对较小但有着许多独立国家的大陆。在通常情况下,穿越多个国家旅行意味着必须多次经历签证申请和护照检查。',
  'transcription': '欧 洲 是 片 面 积 相 对 较 小 但 有 着 许 多 独 立 国 家 的 大 陆 在 通 常 情 况 下 穿 越 多 个 国 家 旅 行 意 味 着 必 须 多 次 经 历 签 证 申 请 和 护 照 检 查',
  '_': '欧 | 洲 | 是 | 片 | 面 | 积 | 相 | 对 | 较 | 小 | 但 | 有 | 着 | 许 | 多 | 独 | 立 | 国 | 家 | 的 | 大 | 陆 | 在 | 通 | 常 | 情 | 况 | 下 | 穿 | 越 | 多 | 个 | 国 | 家 | 旅 | 行 | 意 | 味 | 着 | 必 | 须 | 多 | 次 | 经 | 历 | 签 | 证 | 申 | 请 | 和 | 护 | 照 | 检 | 查 |',
  'num_samples': 234240,
  'gender': 'FEMALE'},
 {'id': 1689,
  'file_name': '8997072507946499537.wav',
  'raw_transcription': '欧洲是片面积相对较小但有着许多独立国家的大陆。在通常情况下,穿越多个国家旅行意味着必须多次经历签证申请和护照检查。',
  'transcription': '欧 洲 是 片 面 积 相 对 较 小 但 有 着 许 多 独 立 国 家 的 大 陆 在 通 常 情 况 下 穿 越 多 个 国 家 旅 行 意 味 着 必 须 多 次 经 历 签 证 申 请 和 护 照 检 查',
  '_': '欧 | 洲 | 是 | 片 | 面 | 积 | 相 | 对 | 较 | 小 | 但 | 有 | 着 | 许 | 多 | 独 | 立 | 国 | 家 | 的 | 大 | 陆 | 在 | 通 | 常 | 情 | 况 | 下 | 穿 | 越 | 多 | 个 | 国 | 家 | 旅 | 行 | 意 | 味 | 着 | 必 | 须 | 多 | 次 | 经 | 历 | 签 | 证 | 申 | 请 | 和 | 护 | 照 | 检 | 查 |',
  'num_samples': 197760,
  'gender': 'FEMALE'},
 {'id': 1746,
  'file_name': '3206459728499873363.wav',
  'raw_transcription': '植物通过光合作用从阳光中获取养分。它们还能提供荫凉。',
  'transcription': '植 物 通 过 光 合 作 用 从 阳 光 中 获 取 养 分 它 们 还 能 提 供 荫 凉',
  '_': '植 | 物 | 通 | 过 | 光 | 合 | 作 | 用 | 从 | 阳 | 光 | 中 | 获 | 取 | 养 | 分 | 它 | 们 | 还 | 能 | 提 | 供 | 荫 | 凉 |',
  'num_samples': 100800,
  'gender': 'FEMALE'},
 {'id': 1746,
  'file_name': '7438538423723416883.wav',
  'raw_transcription': '植物通过光合作用从阳光中获取养分。它们还能提供荫凉。',
  'transcription': '植 物 通 过 光 合 作 用 从 阳 光 中 获 取 养 分 它 们 还 能 提 供 荫 凉',
  '_': '植 | 物 | 通 | 过 | 光 | 合 | 作 | 用 | 从 | 阳 | 光 | 中 | 获 | 取 | 养 | 分 | 它 | 们 | 还 | 能 | 提 | 供 | 荫 | 凉 |',
  'num_samples': 102720,
  'gender': 'FEMALE'},
 {'id': 1746,
  'file_name': '14232909159785623378.wav',
  'raw_transcription': '植物通过光合作用从阳光中获取养分。它们还能提供荫凉。',
  'transcription': '植 物 通 过 光 合 作 用 从 阳 光 中 获 取 养 分 它 们 还 能 提 供 荫 凉',
  '_': '植 | 物 | 通 | 过 | 光 | 合 | 作 | 用 | 从 | 阳 | 光 | 中 | 获 | 取 | 养 | 分 | 它 | 们 | 还 | 能 | 提 | 供 | 荫 | 凉 |',
  'num_samples': 124800,
  'gender': 'MALE'},
 {'id': 1677,
  'file_name': '2696764943147854999.wav',
  'raw_transcription': '如今,唯一不能向后折叠翅膀的昆虫是蜻蜓和蜉蝣。',
  'transcription': '如 今 唯 一 不 能 向 后 折 叠 翅 膀 的 昆 虫 是 蜻 蜓 和 蜉 蝣',
  '_': '如 | 今 | 唯 | 一 | 不 | 能 | 向 | 后 | 折 | 叠 | 翅 | 膀 | 的 | 昆 | 虫 | 是 | 蜻 | 蜓 | 和 | 蜉 | 蝣 |',
  'num_samples': 100800,
  'gender': 'FEMALE'},
 {'id': 1677,
  'file_name': '16772375859841179841.wav',
  'raw_transcription': '如今,唯一不能向后折叠翅膀的昆虫是蜻蜓和蜉蝣。',
  'transcription': '如 今 唯 一 不 能 向 后 折 叠 翅 膀 的 昆 虫 是 蜻 蜓 和 蜉 蝣',
  '_': '如 | 今 | 唯 | 一 | 不 | 能 | 向 | 后 | 折 | 叠 | 翅 | 膀 | 的 | 昆 | 虫 | 是 | 蜻 | 蜓 | 和 | 蜉 | 蝣 |',
  'num_samples': 127680,
  'gender': 'MALE'},
 {'id': 1668,
  'file_name': '14773716009564433047.wav',
  'raw_transcription': '买一张万能卡(Wild Card)也有不少好处。带着这张卡,你可以进入南非的一些公园或全部的国家公园。',
  'transcription': '买 一 张 万 能 卡 wild card 也 有 不 少 好 处 带 着 这 张 卡 你 可 以 进 入 南 非 的 一 些 公 园 或 全 部 的 国 家 公 园',
  '_': '买 | 一 | 张 | 万 | 能 | 卡 | w i l d | c a r d | 也 | 有 | 不 | 少 | 好 | 处 | 带 | 着 | 这 | 张 | 卡 | 你 | 可 | 以 | 进 | 入 | 南 | 非 | 的 | 一 | 些 | 公 | 园 | 或 | 全 | 部 | 的 | 国 | 家 | 公 | 园 |',
  'num_samples': 140160,
  'gender': 'FEMALE'},
 {'id': 1668,
  'file_name': '9952685606966035398.wav',
  'raw_transcription': '买一张万能卡(Wild Card)也有不少好处。带着这张卡,你可以进入南非的一些公园或全部的国家公园。',
  'transcription': '买 一 张 万 能 卡 wild card 也 有 不 少 好 处 带 着 这 张 卡 你 可 以 进 入 南 非 的 一 些 公 园 或 全 部 的 国 家 公 园',
  '_': '买 | 一 | 张 | 万 | 能 | 卡 | w i l d | c a r d | 也 | 有 | 不 | 少 | 好 | 处 | 带 | 着 | 这 | 张 | 卡 | 你 | 可 | 以 | 进 | 入 | 南 | 非 | 的 | 一 | 些 | 公 | 园 | 或 | 全 | 部 | 的 | 国 | 家 | 公 | 园 |',
  'num_samples': 218880,
  'gender': 'MALE'},
 {'id': 1668,
  'file_name': '14948927894507528293.wav',
  'raw_transcription': '买一张万能卡(Wild Card)也有不少好处。带着这张卡,你可以进入南非的一些公园或全部的国家公园。',
  'transcription': '买 一 张 万 能 卡 wild card 也 有 不 少 好 处 带 着 这 张 卡 你 可 以 进 入 南 非 的 一 些 公 园 或 全 部 的 国 家 公 园',
  '_': '买 | 一 | 张 | 万 | 能 | 卡 | w i l d | c a r d | 也 | 有 | 不 | 少 | 好 | 处 | 带 | 着 | 这 | 张 | 卡 | 你 | 可 | 以 | 进 | 入 | 南 | 非 | 的 | 一 | 些 | 公 | 园 | 或 | 全 | 部 | 的 | 国 | 家 | 公 | 园 |',
  'num_samples': 129600,
  'gender': 'FEMALE'},
 {'id': 1998,
  'file_name': '6716768650671689929.wav',
  'raw_transcription': '它们脚上有鳞片和爪子,会产卵,还像霸王龙一样用两条后腿走路。',
  'transcription': '它 们 脚 上 有 鳞 片 和 爪 子 会 产 卵 还 像 霸 王 龙 一 样 用 两 条 后 腿 走 路',
  '_': '它 | 们 | 脚 | 上 | 有 | 鳞 | 片 | 和 | 爪 | 子 | 会 | 产 | 卵 | 还 | 像 | 霸 | 王 | 龙 | 一 | 样 | 用 | 两 | 条 | 后 | 腿 | 走 | 路 |',
  'num_samples': 100800,
  'gender': 'FEMALE'},
 {'id': 1998,
  'file_name': '2131574129003004633.wav',
  'raw_transcription': '它们脚上有鳞片和爪子,会产卵,还像霸王龙一样用两条后腿走路。',
  'transcription': '它 们 脚 上 有 鳞 片 和 爪 子 会 产 卵 还 像 霸 王 龙 一 样 用 两 条 后 腿 走 路',
  '_': '它 | 们 | 脚 | 上 | 有 | 鳞 | 片 | 和 | 爪 | 子 | 会 | 产 | 卵 | 还 | 像 | 霸 | 王 | 龙 | 一 | 样 | 用 | 两 | 条 | 后 | 腿 | 走 | 路 |',
  'num_samples': 140160,
  'gender': 'MALE'},
 {'id': 1998,
  'file_name': '1208858543369565748.wav',
  'raw_transcription': '它们脚上有鳞片和爪子,会产卵,还像霸王龙一样用两条后腿走路。',
  'transcription': '它 们 脚 上 有 鳞 片 和 爪 子 会 产 卵 还 像 霸 王 龙 一 样 用 两 条 后 腿 走 路',
  '_': '它 | 们 | 脚 | 上 | 有 | 鳞 | 片 | 和 | 爪 | 子 | 会 | 产 | 卵 | 还 | 像 | 霸 | 王 | 龙 | 一 | 样 | 用 | 两 | 条 | 后 | 腿 | 走 | 路 |',
  'num_samples': 104640,
  'gender': 'FEMALE'},
 {'id': 1767,
  'file_name': '7379384499422271010.wav',
  'raw_transcription': '这提供了一个可以看到北极光的绝佳机会,因为天空将或多或少连续一整天都是暗的。',
  'transcription': '这 提 供 了 一 个 可 以 看 到 北 极 光 的 绝 佳 机 会 因 为 天 空 将 或 多 或 少 连 续 一 整 天 都 是 暗 的',
  '_': '这 | 提 | 供 | 了 | 一 | 个 | 可 | 以 | 看 | 到 | 北 | 极 | 光 | 的 | 绝 | 佳 | 机 | 会 | 因 | 为 | 天 | 空 | 将 | 或 | 多 | 或 | 少 | 连 | 续 | 一 | 整 | 天 | 都 | 是 | 暗 | 的 |',
  'num_samples': 213440,
  'gender': 'MALE'},
 {'id': 1767,
  'file_name': '973788936324698621.wav',
  'raw_transcription': '这提供了一个可以看到北极光的绝佳机会,因为天空将或多或少连续一整天都是暗的。',
  'transcription': '这 提 供 了 一 个 可 以 看 到 北 极 光 的 绝 佳 机 会 因 为 天 空 将 或 多 或 少 连 续 一 整 天 都 是 暗 的',
  '_': '这 | 提 | 供 | 了 | 一 | 个 | 可 | 以 | 看 | 到 | 北 | 极 | 光 | 的 | 绝 | 佳 | 机 | 会 | 因 | 为 | 天 | 空 | 将 | 或 | 多 | 或 | 少 | 连 | 续 | 一 | 整 | 天 | 都 | 是 | 暗 | 的 |',
  'num_samples': 143040,
  'gender': 'MALE'},
 {'id': 1969,
  'file_name': '4041179857536976168.wav',
  'raw_transcription': '它指出,对主体来说最有效的位置是将图像垂直和水平分为三部分的线的交叉点(见示例)。',
  'transcription': '它 指 出 对 主 体 来 说 最 有 效 的 位 置 是 将 图 像 垂 直 和 水 平 分 为 三 部 分 的 线 的 交 叉 点 见 示 例',
  '_': '它 | 指 | 出 | 对 | 主 | 体 | 来 | 说 | 最 | 有 | 效 | 的 | 位 | 置 | 是 | 将 | 图 | 像 | 垂 | 直 | 和 | 水 | 平 | 分 | 为 | 三 | 部 | 分 | 的 | 线 | 的 | 交 | 叉 | 点 | 见 | 示 | 例 |',
  'num_samples': 245760,
  'gender': 'MALE'},
 {'id': 1969,
  'file_name': '870219628413797707.wav',
  'raw_transcription': '它指出,对主体来说最有效的位置是将图像垂直和水平分为三部分的线的交叉点(见示例)。',
  'transcription': '它 指 出 对 主 体 来 说 最 有 效 的 位 置 是 将 图 像 垂 直 和 水 平 分 为 三 部 分 的 线 的 交 叉 点 见 示 例',
  '_': '它 | 指 | 出 | 对 | 主 | 体 | 来 | 说 | 最 | 有 | 效 | 的 | 位 | 置 | 是 | 将 | 图 | 像 | 垂 | 直 | 和 | 水 | 平 | 分 | 为 | 三 | 部 | 分 | 的 | 线 | 的 | 交 | 叉 | 点 | 见 | 示 | 例 |',
  'num_samples': 226880,
  'gender': 'MALE'},
 {'id': 1969,
  'file_name': '14917204031462831055.wav',
  'raw_transcription': '它指出,对主体来说最有效的位置是将图像垂直和水平分为三部分的线的交叉点(见示例)。',
  'transcription': '它 指 出 对 主 体 来 说 最 有 效 的 位 置 是 将 图 像 垂 直 和 水 平 分 为 三 部 分 的 线 的 交 叉 点 见 示 例',
  '_': '它 | 指 | 出 | 对 | 主 | 体 | 来 | 说 | 最 | 有 | 效 | 的 | 位 | 置 | 是 | 将 | 图 | 像 | 垂 | 直 | 和 | 水 | 平 | 分 | 为 | 三 | 部 | 分 | 的 | 线 | 的 | 交 | 叉 | 点 | 见 | 示 | 例 |',
  'num_samples': 145920,
  'gender': 'FEMALE'},
 {'id': 1763,
  'file_name': '10182944938509562796.wav',
  'raw_transcription': '就像月球对地球施加拉力,引起潮汐一样,银河系也对人马座星系施加着作用力。',
  'transcription': '就 像 月 球 对 地 球 施 加 拉 力 引 起 潮 汐 一 样 银 河 系 也 对 人 马 座 星 系 施 加 着 作 用 力',
  '_': '就 | 像 | 月 | 球 | 对 | 地 | 球 | 施 | 加 | 拉 | 力 | 引 | 起 | 潮 | 汐 | 一 | 样 | 银 | 河 | 系 | 也 | 对 | 人 | 马 | 座 | 星 | 系 | 施 | 加 | 着 | 作 | 用 | 力 |',
  'num_samples': 240000,
  'gender': 'MALE'},
 {'id': 1763,
  'file_name': '11163566766388027034.wav',
  'raw_transcription': '就像月球对地球施加拉力,引起潮汐一样,银河系也对人马座星系施加着作用力。',
  'transcription': '就 像 月 球 对 地 球 施 加 拉 力 引 起 潮 汐 一 样 银 河 系 也 对 人 马 座 星 系 施 加 着 作 用 力',
  '_': '就 | 像 | 月 | 球 | 对 | 地 | 球 | 施 | 加 | 拉 | 力 | 引 | 起 | 潮 | 汐 | 一 | 样 | 银 | 河 | 系 | 也 | 对 | 人 | 马 | 座 | 星 | 系 | 施 | 加 | 着 | 作 | 用 | 力 |',
  'num_samples': 120960,
  'gender': 'FEMALE'},
 {'id': 1856,
  'file_name': '14922948868987632438.wav',
  'raw_transcription': '芬兰是绝佳的帆船运动圣地, 素有“千湖之乡”的美誉 ,在其湖泊和沿海群岛范围内也含有数千座岛屿。',
  'transcription': '芬 兰 是 绝 佳 的 帆 船 运 动 圣 地 素 有 千 湖 之 乡 的 美 誉 在 其 湖 泊 和 沿 海 群 岛 范 围 内 也 含 有 数 千 座 岛 屿',
  '_': '芬 | 兰 | 是 | 绝 | 佳 | 的 | 帆 | 船 | 运 | 动 | 圣 | 地 | 素 | 有 | 千 | 湖 | 之 | 乡 | 的 | 美 | 誉 | 在 | 其 | 湖 | 泊 | 和 | 沿 | 海 | 群 | 岛 | 范 | 围 | 内 | 也 | 含 | 有 | 数 | 千 | 座 | 岛 | 屿 |',
  'num_samples': 146880,
  'gender': 'FEMALE'},
 {'id': 1856,
  'file_name': '2637693422841646436.wav',
  'raw_transcription': '芬兰是绝佳的帆船运动圣地, 素有“千湖之乡”的美誉 ,在其湖泊和沿海群岛范围内也含有数千座岛屿。',
  'transcription': '芬 兰 是 绝 佳 的 帆 船 运 动 圣 地 素 有 千 湖 之 乡 的 美 誉 在 其 湖 泊 和 沿 海 群 岛 范 围 内 也 含 有 数 千 座 岛 屿',
  '_': '芬 | 兰 | 是 | 绝 | 佳 | 的 | 帆 | 船 | 运 | 动 | 圣 | 地 | 素 | 有 | 千 | 湖 | 之 | 乡 | 的 | 美 | 誉 | 在 | 其 | 湖 | 泊 | 和 | 沿 | 海 | 群 | 岛 | 范 | 围 | 内 | 也 | 含 | 有 | 数 | 千 | 座 | 岛 | 屿 |',
  'num_samples': 176640,
  'gender': 'FEMALE'},
 {'id': 1856,
  'file_name': '15440819358190460877.wav',
  'raw_transcription': '芬兰是绝佳的帆船运动圣地, 素有“千湖之乡”的美誉 ,在其湖泊和沿海群岛范围内也含有数千座岛屿。',
  'transcription': '芬 兰 是 绝 佳 的 帆 船 运 动 圣 地 素 有 千 湖 之 乡 的 美 誉 在 其 湖 泊 和 沿 海 群 岛 范 围 内 也 含 有 数 千 座 岛 屿',
  '_': '芬 | 兰 | 是 | 绝 | 佳 | 的 | 帆 | 船 | 运 | 动 | 圣 | 地 | 素 | 有 | 千 | 湖 | 之 | 乡 | 的 | 美 | 誉 | 在 | 其 | 湖 | 泊 | 和 | 沿 | 海 | 群 | 岛 | 范 | 围 | 内 | 也 | 含 | 有 | 数 | 千 | 座 | 岛 | 屿 |',
  'num_samples': 213120,
  'gender': 'MALE'},
 {'id': 1819,
  'file_name': '11229316681957753488.wav',
  'raw_transcription': '中国古代的不同时期各有特点;中国的每个时期或每个执掌天下的家族都是一个特点鲜明的王朝。',
  'transcription': '中 国 古 代 的 不 同 时 期 各 有 特 点 中 国 的 每 个 时 期 或 每 个 执 掌 天 下 的 家 族 都 是 一 个 特 点 鲜 明 的 王 朝',
  '_': '中 | 国 | 古 | 代 | 的 | 不 | 同 | 时 | 期 | 各 | 有 | 特 | 点 | 中 | 国 | 的 | 每 | 个 | 时 | 期 | 或 | 每 | 个 | 执 | 掌 | 天 | 下 | 的 | 家 | 族 | 都 | 是 | 一 | 个 | 特 | 点 | 鲜 | 明 | 的 | 王 | 朝 |',
  'num_samples': 144000,
  'gender': 'FEMALE'},
 {'id': 1819,
  'file_name': '2726540722471460586.wav',
  'raw_transcription': '中国古代的不同时期各有特点;中国的每个时期或每个执掌天下的家族都是一个特点鲜明的王朝。',
  'transcription': '中 国 古 代 的 不 同 时 期 各 有 特 点 中 国 的 每 个 时 期 或 每 个 执 掌 天 下 的 家 族 都 是 一 个 特 点 鲜 明 的 王 朝',
  '_': '中 | 国 | 古 | 代 | 的 | 不 | 同 | 时 | 期 | 各 | 有 | 特 | 点 | 中 | 国 | 的 | 每 | 个 | 时 | 期 | 或 | 每 | 个 | 执 | 掌 | 天 | 下 | 的 | 家 | 族 | 都 | 是 | 一 | 个 | 特 | 点 | 鲜 | 明 | 的 | 王 | 朝 |',
  'num_samples': 165120,
  'gender': 'MALE'},
 {'id': 1877,
  'file_name': '16788292943109515420.wav',
  'raw_transcription': '现任参议员、阿根廷第一夫人克里斯蒂娜·费尔南德斯·德·柯克纳 (Cristina Fernandez de Kirchner) 昨晚在距离布宜诺斯艾利斯 50 公里(31英里)的拉普拉塔市 (La Plata) 宣布了其总统竞选资格。',
  'transcription': '现 任 参 议 员 阿 根 廷 第 一 夫 人 克 里 斯 蒂 娜 费 尔 南 德 斯 德 柯 克 纳 cristina fernandez de kirchner 昨 晚 在 距 离 布 宜 诺 斯 艾 利 斯 50 公 里 31 英 里 的 拉 普 拉 塔 市 la plata 宣 布 了 其 总 统 竞 选 资 格',
  '_': '现 | 任 | 参 | 议 | 员 | 阿 | 根 | 廷 | 第 | 一 | 夫 | 人 | 克 | 里 | 斯 | 蒂 | 娜 | 费 | 尔 | 南 | 德 | 斯 | 德 | 柯 | 克 | 纳 | c r i s t i n a | f e r n a n d e z | d e | k i r c h n e r | 昨 | 晚 | 在 | 距 | 离 | 布 | 宜 | 诺 | 斯 | 艾 | 利 | 斯 | 5 0 | 公 | 里 | 3 1 | 英 | 里 | 的 | 拉 | 普 | 拉 | 塔 | 市 | l a | p l a t a | 宣 | 布 | 了 | 其 | 总 | 统 | 竞 | 选 | 资 | 格 |',
  'num_samples': 274560,
  'gender': 'FEMALE'},
 {'id': 1877,
  'file_name': '12513493841059400373.wav',
  'raw_transcription': '现任参议员、阿根廷第一夫人克里斯蒂娜·费尔南德斯·德·柯克纳 (Cristina Fernandez de Kirchner) 昨晚在距离布宜诺斯艾利斯 50 公里(31英里)的拉普拉塔市 (La Plata) 宣布了其总统竞选资格。',
  'transcription': '现 任 参 议 员 阿 根 廷 第 一 夫 人 克 里 斯 蒂 娜 费 尔 南 德 斯 德 柯 克 纳 cristina fernandez de kirchner 昨 晚 在 距 离 布 宜 诺 斯 艾 利 斯 50 公 里 31 英 里 的 拉 普 拉 塔 市 la plata 宣 布 了 其 总 统 竞 选 资 格',
  '_': '现 | 任 | 参 | 议 | 员 | 阿 | 根 | 廷 | 第 | 一 | 夫 | 人 | 克 | 里 | 斯 | 蒂 | 娜 | 费 | 尔 | 南 | 德 | 斯 | 德 | 柯 | 克 | 纳 | c r i s t i n a | f e r n a n d e z | d e | k i r c h n e r | 昨 | 晚 | 在 | 距 | 离 | 布 | 宜 | 诺 | 斯 | 艾 | 利 | 斯 | 5 0 | 公 | 里 | 3 1 | 英 | 里 | 的 | 拉 | 普 | 拉 | 塔 | 市 | l a | p l a t a | 宣 | 布 | 了 | 其 | 总 | 统 | 竞 | 选 | 资 | 格 |',
  'num_samples': 381120,
  'gender': 'MALE'},
 {'id': 1877,
  'file_name': '2092177770984099604.wav',
  'raw_transcription': '现任参议员、阿根廷第一夫人克里斯蒂娜·费尔南德斯·德·柯克纳 (Cristina Fernandez de Kirchner) 昨晚在距离布宜诺斯艾利斯 50 公里(31英里)的拉普拉塔市 (La Plata) 宣布了其总统竞选资格。',
  'transcription': '现 任 参 议 员 阿 根 廷 第 一 夫 人 克 里 斯 蒂 娜 费 尔 南 德 斯 德 柯 克 纳 cristina fernandez de kirchner 昨 晚 在 距 离 布 宜 诺 斯 艾 利 斯 50 公 里 31 英 里 的 拉 普 拉 塔 市 la plata 宣 布 了 其 总 统 竞 选 资 格',
  '_': '现 | 任 | 参 | 议 | 员 | 阿 | 根 | 廷 | 第 | 一 | 夫 | 人 | 克 | 里 | 斯 | 蒂 | 娜 | 费 | 尔 | 南 | 德 | 斯 | 德 | 柯 | 克 | 纳 | c r i s t i n a | f e r n a n d e z | d e | k i r c h n e r | 昨 | 晚 | 在 | 距 | 离 | 布 | 宜 | 诺 | 斯 | 艾 | 利 | 斯 | 5 0 | 公 | 里 | 3 1 | 英 | 里 | 的 | 拉 | 普 | 拉 | 塔 | 市 | l a | p l a t a | 宣 | 布 | 了 | 其 | 总 | 统 | 竞 | 选 | 资 | 格 |',
  'num_samples': 323520,
  'gender': 'MALE'},
 {'id': 1700,
  'file_name': '2931797764244288828.wav',
  'raw_transcription': '阴暗面下面的地壳薄一些,高地下的地壳厚一些。',
  'transcription': '阴 暗 面 下 面 的 地 壳 薄 一 些 高 地 下 的 地 壳 厚 一 些',
  '_': '阴 | 暗 | 面 | 下 | 面 | 的 | 地 | 壳 | 薄 | 一 | 些 | 高 | 地 | 下 | 的 | 地 | 壳 | 厚 | 一 | 些 |',
  'num_samples': 86400,
  'gender': 'FEMALE'},
 {'id': 1700,
  'file_name': '10651933140664828475.wav',
  'raw_transcription': '阴暗面下面的地壳薄一些,高地下的地壳厚一些。',
  'transcription': '阴 暗 面 下 面 的 地 壳 薄 一 些 高 地 下 的 地 壳 厚 一 些',
  '_': '阴 | 暗 | 面 | 下 | 面 | 的 | 地 | 壳 | 薄 | 一 | 些 | 高 | 地 | 下 | 的 | 地 | 壳 | 厚 | 一 | 些 |',
  'num_samples': 201920,
  'gender': 'MALE'},
 {'id': 1700,
  'file_name': '15551630401427082201.wav',
  'raw_transcription': '阴暗面下面的地壳薄一些,高地下的地壳厚一些。',
  'transcription': '阴 暗 面 下 面 的 地 壳 薄 一 些 高 地 下 的 地 壳 厚 一 些',
  '_': '阴 | 暗 | 面 | 下 | 面 | 的 | 地 | 壳 | 薄 | 一 | 些 | 高 | 地 | 下 | 的 | 地 | 壳 | 厚 | 一 | 些 |',
  'num_samples': 81600,
  'gender': 'FEMALE'},
 {'id': 1939,
  'file_name': '12040319549933401783.wav',
  'raw_transcription': '此外,在革命之后,官职面向全体男性开放申请,这使得最有抱负、最成功之人有机会飞黄腾达。',
  'transcription': '此 外 在 革 命 之 后 官 职 面 向 全 体 男 性 开 放 申 请 这 使 得 最 有 抱 负 最 成 功 之 人 有 机 会 飞 黄 腾 达',
  '_': '此 | 外 | 在 | 革 | 命 | 之 | 后 | 官 | 职 | 面 | 向 | 全 | 体 | 男 | 性 | 开 | 放 | 申 | 请 | 这 | 使 | 得 | 最 | 有 | 抱 | 负 | 最 | 成 | 功 | 之 | 人 | 有 | 机 | 会 | 飞 | 黄 | 腾 | 达 |',
  'num_samples': 251840,
  'gender': 'MALE'},
 {'id': 1939,
  'file_name': '1351715574318686401.wav',
  'raw_transcription': '此外,在革命之后,官职面向全体男性开放申请,这使得最有抱负、最成功之人有机会飞黄腾达。',
  'transcription': '此 外 在 革 命 之 后 官 职 面 向 全 体 男 性 开 放 申 请 这 使 得 最 有 抱 负 最 成 功 之 人 有 机 会 飞 黄 腾 达',
  '_': '此 | 外 | 在 | 革 | 命 | 之 | 后 | 官 | 职 | 面 | 向 | 全 | 体 | 男 | 性 | 开 | 放 | 申 | 请 | 这 | 使 | 得 | 最 | 有 | 抱 | 负 | 最 | 成 | 功 | 之 | 人 | 有 | 机 | 会 | 飞 | 黄 | 腾 | 达 |',
  'num_samples': 283200,
  'gender': 'MALE'},
 {'id': 1939,
  'file_name': '9366313109534160336.wav',
  'raw_transcription': '此外,在革命之后,官职面向全体男性开放申请,这使得最有抱负、最成功之人有机会飞黄腾达。',
  'transcription': '此 外 在 革 命 之 后 官 职 面 向 全 体 男 性 开 放 申 请 这 使 得 最 有 抱 负 最 成 功 之 人 有 机 会 飞 黄 腾 达',
  '_': '此 | 外 | 在 | 革 | 命 | 之 | 后 | 官 | 职 | 面 | 向 | 全 | 体 | 男 | 性 | 开 | 放 | 申 | 请 | 这 | 使 | 得 | 最 | 有 | 抱 | 负 | 最 | 成 | 功 | 之 | 人 | 有 | 机 | 会 | 飞 | 黄 | 腾 | 达 |',
  'num_samples': 193920,
  'gender': 'MALE'},
 {'id': 1898,
  'file_name': '5012217927448025717.wav',
  'raw_transcription': '“说穿了,他[威尔斯]从一开始就对我们撒谎。首先,他表现得好像是出于法律原因才这么做。其次,他先是假装听取我们的意见,然后直接删除了这些艺术作品。”',
  'transcription': '说 穿 了 他 威 尔 斯 从 一 开 始 就 对 我 们 撒 谎 首 先 他 表 现 得 好 像 是 出 于 法 律 原 因 才 这 么 做 其 次 他 先 是 假 装 听 取 我 们 的 意 见 然 后 直 接 删 除 了 这 些 艺 术 作 品',
  '_': '说 | 穿 | 了 | 他 | 威 | 尔 | 斯 | 从 | 一 | 开 | 始 | 就 | 对 | 我 | 们 | 撒 | 谎 | 首 | 先 | 他 | 表 | 现 | 得 | 好 | 像 | 是 | 出 | 于 | 法 | 律 | 原 | 因 | 才 | 这 | 么 | 做 | 其 | 次 | 他 | 先 | 是 | 假 | 装 | 听 | 取 | 我 | 们 | 的 | 意 | 见 | 然 | 后 | 直 | 接 | 删 | 除 | 了 | 这 | 些 | 艺 | 术 | 作 | 品 |',
  'num_samples': 189120,
  'gender': 'FEMALE'},
 {'id': 1898,
  'file_name': '9074142952924218933.wav',
  'raw_transcription': '“说穿了,他[威尔斯]从一开始就对我们撒谎。首先,他表现得好像是出于法律原因才这么做。其次,他先是假装听取我们的意见,然后直接删除了这些艺术作品。”',
  'transcription': '说 穿 了 他 威 尔 斯 从 一 开 始 就 对 我 们 撒 谎 首 先 他 表 现 得 好 像 是 出 于 法 律 原 因 才 这 么 做 其 次 他 先 是 假 装 听 取 我 们 的 意 见 然 后 直 接 删 除 了 这 些 艺 术 作 品',
  '_': '说 | 穿 | 了 | 他 | 威 | 尔 | 斯 | 从 | 一 | 开 | 始 | 就 | 对 | 我 | 们 | 撒 | 谎 | 首 | 先 | 他 | 表 | 现 | 得 | 好 | 像 | 是 | 出 | 于 | 法 | 律 | 原 | 因 | 才 | 这 | 么 | 做 | 其 | 次 | 他 | 先 | 是 | 假 | 装 | 听 | 取 | 我 | 们 | 的 | 意 | 见 | 然 | 后 | 直 | 接 | 删 | 除 | 了 | 这 | 些 | 艺 | 术 | 作 | 品 |',
  'num_samples': 359040,
  'gender': 'MALE'},
 {'id': 1916,
  'file_name': '7942082143404604932.wav',
  'raw_transcription': '许多德国烘焙食品也以杏仁、榛子和其他坚果为特色。受欢迎的蛋糕与浓咖啡往往是绝配。',
  'transcription': '许 多 德 国 烘 焙 食 品 也 以 杏 仁 榛 子 和 其 他 坚 果 为 特 色 受 欢 迎 的 蛋 糕 与 浓 咖 啡 往 往 是 绝 配',
  '_': '许 | 多 | 德 | 国 | 烘 | 焙 | 食 | 品 | 也 | 以 | 杏 | 仁 | 榛 | 子 | 和 | 其 | 他 | 坚 | 果 | 为 | 特 | 色 | 受 | 欢 | 迎 | 的 | 蛋 | 糕 | 与 | 浓 | 咖 | 啡 | 往 | 往 | 是 | 绝 | 配 |',
  'num_samples': 146880,
  'gender': 'FEMALE'},
 {'id': 1916,
  'file_name': '7973352938134656115.wav',
  'raw_transcription': '许多德国烘焙食品也以杏仁、榛子和其他坚果为特色。受欢迎的蛋糕与浓咖啡往往是绝配。',
  'transcription': '许 多 德 国 烘 焙 食 品 也 以 杏 仁 榛 子 和 其 他 坚 果 为 特 色 受 欢 迎 的 蛋 糕 与 浓 咖 啡 往 往 是 绝 配',
  '_': '许 | 多 | 德 | 国 | 烘 | 焙 | 食 | 品 | 也 | 以 | 杏 | 仁 | 榛 | 子 | 和 | 其 | 他 | 坚 | 果 | 为 | 特 | 色 | 受 | 欢 | 迎 | 的 | 蛋 | 糕 | 与 | 浓 | 咖 | 啡 | 往 | 往 | 是 | 绝 | 配 |',
  'num_samples': 165120,
  'gender': 'MALE'},
 {'id': 1916,
  'file_name': '6752039573144453409.wav',
  'raw_transcription': '许多德国烘焙食品也以杏仁、榛子和其他坚果为特色。受欢迎的蛋糕与浓咖啡往往是绝配。',
  'transcription': '许 多 德 国 烘 焙 食 品 也 以 杏 仁 榛 子 和 其 他 坚 果 为 特 色 受 欢 迎 的 蛋 糕 与 浓 咖 啡 往 往 是 绝 配',
  '_': '许 | 多 | 德 | 国 | 烘 | 焙 | 食 | 品 | 也 | 以 | 杏 | 仁 | 榛 | 子 | 和 | 其 | 他 | 坚 | 果 | 为 | 特 | 色 | 受 | 欢 | 迎 | 的 | 蛋 | 糕 | 与 | 浓 | 咖 | 啡 | 往 | 往 | 是 | 绝 | 配 |',
  'num_samples': 177600,
  'gender': 'MALE'},
 {'id': 1975,
  'file_name': '5772332023499738889.wav',
  'raw_transcription': '梵蒂冈城的人口大约有 800 人。它是世界上最小的独立国家,也是人口最少的国家。',
  'transcription': '梵 蒂 冈 城 的 人 口 大 约 有 800 人 它 是 世 界 上 最 小 的 独 立 国 家 也 是 人 口 最 少 的 国 家',
  '_': '梵 | 蒂 | 冈 | 城 | 的 | 人 | 口 | 大 | 约 | 有 | 8 0 0 | 人 | 它 | 是 | 世 | 界 | 上 | 最 | 小 | 的 | 独 | 立 | 国 | 家 | 也 | 是 | 人 | 口 | 最 | 少 | 的 | 国 | 家 |',
  'num_samples': 168960,
  'gender': 'MALE'},
 {'id': 1975,
  'file_name': '15577986460582751240.wav',
  'raw_transcription': '梵蒂冈城的人口大约有 800 人。它是世界上最小的独立国家,也是人口最少的国家。',
  'transcription': '梵 蒂 冈 城 的 人 口 大 约 有 800 人 它 是 世 界 上 最 小 的 独 立 国 家 也 是 人 口 最 少 的 国 家',
  '_': '梵 | 蒂 | 冈 | 城 | 的 | 人 | 口 | 大 | 约 | 有 | 8 0 0 | 人 | 它 | 是 | 世 | 界 | 上 | 最 | 小 | 的 | 独 | 立 | 国 | 家 | 也 | 是 | 人 | 口 | 最 | 少 | 的 | 国 | 家 |',
  'num_samples': 139200,
  'gender': 'MALE'},
 {'id': 1975,
  'file_name': '13953139953048790899.wav',
  'raw_transcription': '梵蒂冈城的人口大约有 800 人。它是世界上最小的独立国家,也是人口最少的国家。',
  'transcription': '梵 蒂 冈 城 的 人 口 大 约 有 800 人 它 是 世 界 上 最 小 的 独 立 国 家 也 是 人 口 最 少 的 国 家',
  '_': '梵 | 蒂 | 冈 | 城 | 的 | 人 | 口 | 大 | 约 | 有 | 8 0 0 | 人 | 它 | 是 | 世 | 界 | 上 | 最 | 小 | 的 | 独 | 立 | 国 | 家 | 也 | 是 | 人 | 口 | 最 | 少 | 的 | 国 | 家 |',
  'num_samples': 112320,
  'gender': 'FEMALE'},
 {'id': 1822,
  'file_name': '7463245685053630466.wav',
  'raw_transcription': '摩洛哥苏丹将该市重建为 Daru l-Badya。西班牙商人在这里建立了贸易基地,并将其命名为卡萨布兰卡。',
  'transcription': '摩 洛 哥 苏 丹 将 该 市 重 建 为 daru l-badya 西 班 牙 商 人 在 这 里 建 立 了 贸 易 基 地 并 将 其 命 名 为 卡 萨 布 兰 卡',
  '_': '摩 | 洛 | 哥 | 苏 | 丹 | 将 | 该 | 市 | 重 | 建 | 为 | d a r u | l - b a d y a | 西 | 班 | 牙 | 商 | 人 | 在 | 这 | 里 | 建 | 立 | 了 | 贸 | 易 | 基 | 地 | 并 | 将 | 其 | 命 | 名 | 为 | 卡 | 萨 | 布 | 兰 | 卡 |',
  'num_samples': 237120,
  'gender': 'MALE'},
 {'id': 1822,
  'file_name': '11448789813502529641.wav',
  'raw_transcription': '摩洛哥苏丹将该市重建为 Daru l-Badya。西班牙商人在这里建立了贸易基地,并将其命名为卡萨布兰卡。',
  'transcription': '摩 洛 哥 苏 丹 将 该 市 重 建 为 daru l-badya 西 班 牙 商 人 在 这 里 建 立 了 贸 易 基 地 并 将 其 命 名 为 卡 萨 布 兰 卡',
  '_': '摩 | 洛 | 哥 | 苏 | 丹 | 将 | 该 | 市 | 重 | 建 | 为 | d a r u | l - b a d y a | 西 | 班 | 牙 | 商 | 人 | 在 | 这 | 里 | 建 | 立 | 了 | 贸 | 易 | 基 | 地 | 并 | 将 | 其 | 命 | 名 | 为 | 卡 | 萨 | 布 | 兰 | 卡 |',
  'num_samples': 264000,
  'gender': 'MALE'},
 {'id': 1775,
  'file_name': '4934253062441574144.wav',
  'raw_transcription': '录像的使用为阐释微表情(持续几毫秒的面部运动)带来了重大发现。',
  'transcription': '录 像 的 使 用 为 阐 释 微 表 情 持 续 几 毫 秒 的 面 部 运 动 带 来 了 重 大 发 现',
  '_': '录 | 像 | 的 | 使 | 用 | 为 | 阐 | 释 | 微 | 表 | 情 | 持 | 续 | 几 | 毫 | 秒 | 的 | 面 | 部 | 运 | 动 | 带 | 来 | 了 | 重 | 大 | 发 | 现 |',
  'num_samples': 131520,
  'gender': 'FEMALE'},
 {'id': 1775,
  'file_name': '8092027855593857533.wav',
  'raw_transcription': '录像的使用为阐释微表情(持续几毫秒的面部运动)带来了重大发现。',
  'transcription': '录 像 的 使 用 为 阐 释 微 表 情 持 续 几 毫 秒 的 面 部 运 动 带 来 了 重 大 发 现',
  '_': '录 | 像 | 的 | 使 | 用 | 为 | 阐 | 释 | 微 | 表 | 情 | 持 | 续 | 几 | 毫 | 秒 | 的 | 面 | 部 | 运 | 动 | 带 | 来 | 了 | 重 | 大 | 发 | 现 |',
  'num_samples': 127680,
  'gender': 'FEMALE'},
 {'id': 1775,
  'file_name': '6235471105040281221.wav',
  'raw_transcription': '录像的使用为阐释微表情(持续几毫秒的面部运动)带来了重大发现。',
  'transcription': '录 像 的 使 用 为 阐 释 微 表 情 持 续 几 毫 秒 的 面 部 运 动 带 来 了 重 大 发 现',
  '_': '录 | 像 | 的 | 使 | 用 | 为 | 阐 | 释 | 微 | 表 | 情 | 持 | 续 | 几 | 毫 | 秒 | 的 | 面 | 部 | 运 | 动 | 带 | 来 | 了 | 重 | 大 | 发 | 现 |',
  'num_samples': 138240,
  'gender': 'MALE'},
 {'id': 1792,
  'file_name': '10343405611041314630.wav',
  'raw_transcription': '这被称为化学物质的 pH 值。你可以使用红甘蓝汁制作指示剂。',
  'transcription': '这 被 称 为 化 学 物 质 的 ph 值 你 可 以 使 用 红 甘 蓝 汁 制 作 指 示 剂',
  '_': '这 | 被 | 称 | 为 | 化 | 学 | 物 | 质 | 的 | p h | 值 | 你 | 可 | 以 | 使 | 用 | 红 | 甘 | 蓝 | 汁 | 制 | 作 | 指 | 示 | 剂 |',
  'num_samples': 140160,
  'gender': 'MALE'},
 {'id': 1792,
  'file_name': '12747789023760677589.wav',
  'raw_transcription': '这被称为化学物质的 pH 值。你可以使用红甘蓝汁制作指示剂。',
  'transcription': '这 被 称 为 化 学 物 质 的 ph 值 你 可 以 使 用 红 甘 蓝 汁 制 作 指 示 剂',
  '_': '这 | 被 | 称 | 为 | 化 | 学 | 物 | 质 | 的 | p h | 值 | 你 | 可 | 以 | 使 | 用 | 红 | 甘 | 蓝 | 汁 | 制 | 作 | 指 | 示 | 剂 |',
  'num_samples': 248000,
  'gender': 'MALE'},
 {'id': 1792,
  'file_name': '15146714627128264932.wav',
  'raw_transcription': '这被称为化学物质的 pH 值。你可以使用红甘蓝汁制作指示剂。',
  'transcription': '这 被 称 为 化 学 物 质 的 ph 值 你 可 以 使 用 红 甘 蓝 汁 制 作 指 示 剂',
  '_': '这 | 被 | 称 | 为 | 化 | 学 | 物 | 质 | 的 | p h | 值 | 你 | 可 | 以 | 使 | 用 | 红 | 甘 | 蓝 | 汁 | 制 | 作 | 指 | 示 | 剂 |',
  'num_samples': 159360,
  'gender': 'MALE'},
 {'id': 1665,
  'file_name': '11220805329666166649.wav',
  'raw_transcription': '据透露,这份文件将提及边界争端,巴勒斯坦希望以1967年中东战争前的边界为基础。',
  'transcription': '据 透 露 这 份 文 件 将 提 及 边 界 争 端 巴 勒 斯 坦 希 望 以 1967 年 中 东 战 争 前 的 边 界 为 基 础',
  '_': '据 | 透 | 露 | 这 | 份 | 文 | 件 | 将 | 提 | 及 | 边 | 界 | 争 | 端 | 巴 | 勒 | 斯 | 坦 | 希 | 望 | 以 | 1 9 6 7 | 年 | 中 | 东 | 战 | 争 | 前 | 的 | 边 | 界 | 为 | 基 | 础 |',
  'num_samples': 241600,
  'gender': 'MALE'},
 {'id': 1665,
  'file_name': '15043446466465078722.wav',
  'raw_transcription': '据透露,这份文件将提及边界争端,巴勒斯坦希望以1967年中东战争前的边界为基础。',
  'transcription': '据 透 露 这 份 文 件 将 提 及 边 界 争 端 巴 勒 斯 坦 希 望 以 1967 年 中 东 战 争 前 的 边 界 为 基 础',
  '_': '据 | 透 | 露 | 这 | 份 | 文 | 件 | 将 | 提 | 及 | 边 | 界 | 争 | 端 | 巴 | 勒 | 斯 | 坦 | 希 | 望 | 以 | 1 9 6 7 | 年 | 中 | 东 | 战 | 争 | 前 | 的 | 边 | 界 | 为 | 基 | 础 |',
  'num_samples': 218240,
  'gender': 'MALE'},
 {'id': 1665,
  'file_name': '6343836789437987821.wav',
  'raw_transcription': '据透露,这份文件将提及边界争端,巴勒斯坦希望以1967年中东战争前的边界为基础。',
  'transcription': '据 透 露 这 份 文 件 将 提 及 边 界 争 端 巴 勒 斯 坦 希 望 以 1967 年 中 东 战 争 前 的 边 界 为 基 础',
  '_': '据 | 透 | 露 | 这 | 份 | 文 | 件 | 将 | 提 | 及 | 边 | 界 | 争 | 端 | 巴 | 勒 | 斯 | 坦 | 希 | 望 | 以 | 1 9 6 7 | 年 | 中 | 东 | 战 | 争 | 前 | 的 | 边 | 界 | 为 | 基 | 础 |',
  'num_samples': 150720,
  'gender': 'FEMALE'},
 {'id': 1672,
  'file_name': '12601036378860326355.wav',
  'raw_transcription': '小心不要让衣服变得太热(这可能会产生收缩现象,在极端情况下会把衣服烤焦)。',
  'transcription': '小 心 不 要 让 衣 服 变 得 太 热 这 可 能 会 产 生 收 缩 现 象 在 极 端 情 况 下 会 把 衣 服 烤 焦',
  '_': '小 | 心 | 不 | 要 | 让 | 衣 | 服 | 变 | 得 | 太 | 热 | 这 | 可 | 能 | 会 | 产 | 生 | 收 | 缩 | 现 | 象 | 在 | 极 | 端 | 情 | 况 | 下 | 会 | 把 | 衣 | 服 | 烤 | 焦 |',
  'num_samples': 222400,
  'gender': 'MALE'},
 {'id': 1672,
  'file_name': '6541771131687633863.wav',
  'raw_transcription': '小心不要让衣服变得太热(这可能会产生收缩现象,在极端情况下会把衣服烤焦)。',
  'transcription': '小 心 不 要 让 衣 服 变 得 太 热 这 可 能 会 产 生 收 缩 现 象 在 极 端 情 况 下 会 把 衣 服 烤 焦',
  '_': '小 | 心 | 不 | 要 | 让 | 衣 | 服 | 变 | 得 | 太 | 热 | 这 | 可 | 能 | 会 | 产 | 生 | 收 | 缩 | 现 | 象 | 在 | 极 | 端 | 情 | 况 | 下 | 会 | 把 | 衣 | 服 | 烤 | 焦 |',
  'num_samples': 211520,
  'gender': 'MALE'},
 {'id': 1789,
  'file_name': '12033397112670692604.wav',
  'raw_transcription': '其他提名包括最佳影片、最佳导演、最佳摄影、最佳服装设计、最佳电影剪辑、最佳原创配乐、最佳艺术指导、最佳音效剪辑、最佳混音和最佳原创剧本。',
  'transcription': '其 他 提 名 包 括 最 佳 影 片 最 佳 导 演 最 佳 摄 影 最 佳 服 装 设 计 最 佳 电 影 剪 辑 最 佳 原 创 配 乐 最 佳 艺 术 指 导 最 佳 音 效 剪 辑 最 佳 混 音 和 最 佳 原 创 剧 本',
  '_': '其 | 他 | 提 | 名 | 包 | 括 | 最 | 佳 | 影 | 片 | 最 | 佳 | 导 | 演 | 最 | 佳 | 摄 | 影 | 最 | 佳 | 服 | 装 | 设 | 计 | 最 | 佳 | 电 | 影 | 剪 | 辑 | 最 | 佳 | 原 | 创 | 配 | 乐 | 最 | 佳 | 艺 | 术 | 指 | 导 | 最 | 佳 | 音 | 效 | 剪 | 辑 | 最 | 佳 | 混 | 音 | 和 | 最 | 佳 | 原 | 创 | 剧 | 本 |',
  'num_samples': 321920,
  'gender': 'MALE'},
 {'id': 1789,
  'file_name': '8061505693744764604.wav',
  'raw_transcription': '其他提名包括最佳影片、最佳导演、最佳摄影、最佳服装设计、最佳电影剪辑、最佳原创配乐、最佳艺术指导、最佳音效剪辑、最佳混音和最佳原创剧本。',
  'transcription': '其 他 提 名 包 括 最 佳 影 片 最 佳 导 演 最 佳 摄 影 最 佳 服 装 设 计 最 佳 电 影 剪 辑 最 佳 原 创 配 乐 最 佳 艺 术 指 导 最 佳 音 效 剪 辑 最 佳 混 音 和 最 佳 原 创 剧 本',
  '_': '其 | 他 | 提 | 名 | 包 | 括 | 最 | 佳 | 影 | 片 | 最 | 佳 | 导 | 演 | 最 | 佳 | 摄 | 影 | 最 | 佳 | 服 | 装 | 设 | 计 | 最 | 佳 | 电 | 影 | 剪 | 辑 | 最 | 佳 | 原 | 创 | 配 | 乐 | 最 | 佳 | 艺 | 术 | 指 | 导 | 最 | 佳 | 音 | 效 | 剪 | 辑 | 最 | 佳 | 混 | 音 | 和 | 最 | 佳 | 原 | 创 | 剧 | 本 |',
  'num_samples': 167040,
  'gender': 'FEMALE'},
 {'id': 1789,
  'file_name': '2703782239520297166.wav',
  'raw_transcription': '其他提名包括最佳影片、最佳导演、最佳摄影、最佳服装设计、最佳电影剪辑、最佳原创配乐、最佳艺术指导、最佳音效剪辑、最佳混音和最佳原创剧本。',
  'transcription': '其 他 提 名 包 括 最 佳 影 片 最 佳 导 演 最 佳 摄 影 最 佳 服 装 设 计 最 佳 电 影 剪 辑 最 佳 原 创 配 乐 最 佳 艺 术 指 导 最 佳 音 效 剪 辑 最 佳 混 音 和 最 佳 原 创 剧 本',
  '_': '其 | 他 | 提 | 名 | 包 | 括 | 最 | 佳 | 影 | 片 | 最 | 佳 | 导 | 演 | 最 | 佳 | 摄 | 影 | 最 | 佳 | 服 | 装 | 设 | 计 | 最 | 佳 | 电 | 影 | 剪 | 辑 | 最 | 佳 | 原 | 创 | 配 | 乐 | 最 | 佳 | 艺 | 术 | 指 | 导 | 最 | 佳 | 音 | 效 | 剪 | 辑 | 最 | 佳 | 混 | 音 | 和 | 最 | 佳 | 原 | 创 | 剧 | 本 |',
  'num_samples': 178560,
  'gender': 'FEMALE'},
 {'id': 1824,
  'file_name': '2211176532836691628.wav',
  'raw_transcription': '埃及死亡之谷的吉萨(Giza)高原(即“吉萨金字塔群”)包括多个金字塔(其中大金字塔是最大的)、几个小坟墓,几个寺庙和大狮身人面像。',
  'transcription': '埃 及 死 亡 之 谷 的 吉 萨 giza 高 原 即 吉 萨 金 字 塔 群 包 括 多 个 金 字 塔 其 中 大 金 字 塔 是 最 大 的 几 个 小 坟 墓 几 个 寺 庙 和 大 狮 身 人 面 像',
  '_': '埃 | 及 | 死 | 亡 | 之 | 谷 | 的 | 吉 | 萨 | g i z a | 高 | 原 | 即 | 吉 | 萨 | 金 | 字 | 塔 | 群 | 包 | 括 | 多 | 个 | 金 | 字 | 塔 | 其 | 中 | 大 | 金 | 字 | 塔 | 是 | 最 | 大 | 的 | 几 | 个 | 小 | 坟 | 墓 | 几 | 个 | 寺 | 庙 | 和 | 大 | 狮 | 身 | 人 | 面 | 像 |',
  'num_samples': 285120,
  'gender': 'MALE'},
 {'id': 1824,
  'file_name': '18424195408340940678.wav',
  'raw_transcription': '埃及死亡之谷的吉萨(Giza)高原(即“吉萨金字塔群”)包括多个金字塔(其中大金字塔是最大的)、几个小坟墓,几个寺庙和大狮身人面像。',
  'transcription': '埃 及 死 亡 之 谷 的 吉 萨 giza 高 原 即 吉 萨 金 字 塔 群 包 括 多 个 金 字 塔 其 中 大 金 字 塔 是 最 大 的 几 个 小 坟 墓 几 个 寺 庙 和 大 狮 身 人 面 像',
  '_': '埃 | 及 | 死 | 亡 | 之 | 谷 | 的 | 吉 | 萨 | g i z a | 高 | 原 | 即 | 吉 | 萨 | 金 | 字 | 塔 | 群 | 包 | 括 | 多 | 个 | 金 | 字 | 塔 | 其 | 中 | 大 | 金 | 字 | 塔 | 是 | 最 | 大 | 的 | 几 | 个 | 小 | 坟 | 墓 | 几 | 个 | 寺 | 庙 | 和 | 大 | 狮 | 身 | 人 | 面 | 像 |',
  'num_samples': 237120,
  'gender': 'MALE'},
 {'id': 1824,
  'file_name': '4132570483487953453.wav',
  'raw_transcription': '埃及死亡之谷的吉萨(Giza)高原(即“吉萨金字塔群”)包括多个金字塔(其中大金字塔是最大的)、几个小坟墓,几个寺庙和大狮身人面像。',
  'transcription': '埃 及 死 亡 之 谷 的 吉 萨 giza 高 原 即 吉 萨 金 字 塔 群 包 括 多 个 金 字 塔 其 中 大 金 字 塔 是 最 大 的 几 个 小 坟 墓 几 个 寺 庙 和 大 狮 身 人 面 像',
  '_': '埃 | 及 | 死 | 亡 | 之 | 谷 | 的 | 吉 | 萨 | g i z a | 高 | 原 | 即 | 吉 | 萨 | 金 | 字 | 塔 | 群 | 包 | 括 | 多 | 个 | 金 | 字 | 塔 | 其 | 中 | 大 | 金 | 字 | 塔 | 是 | 最 | 大 | 的 | 几 | 个 | 小 | 坟 | 墓 | 几 | 个 | 寺 | 庙 | 和 | 大 | 狮 | 身 | 人 | 面 | 像 |',
  'num_samples': 207360,
  'gender': 'MALE'},
 {'id': 1881,
  'file_name': '3301332850967638732.wav',
  'raw_transcription': '以虚拟方式分享实地考察,也是回顾行程以及与以后班级分享经验的好办法。',
  'transcription': '以 虚 拟 方 式 分 享 实 地 考 察 也 是 回 顾 行 程 以 及 与 以 后 班 级 分 享 经 验 的 好 办 法',
  '_': '以 | 虚 | 拟 | 方 | 式 | 分 | 享 | 实 | 地 | 考 | 察 | 也 | 是 | 回 | 顾 | 行 | 程 | 以 | 及 | 与 | 以 | 后 | 班 | 级 | 分 | 享 | 经 | 验 | 的 | 好 | 办 | 法 |',
  'num_samples': 211200,
  'gender': 'MALE'},
 {'id': 1917,
  'file_name': '13937505463896941487.wav',
  'raw_transcription': '罗马各地安装了数个大型电视屏幕,供人们观看仪式。',
  'transcription': '罗 马 各 地 安 装 了 数 个 大 型 电 视 屏 幕 供 人 们 观 看 仪 式',
  '_': '罗 | 马 | 各 | 地 | 安 | 装 | 了 | 数 | 个 | 大 | 型 | 电 | 视 | 屏 | 幕 | 供 | 人 | 们 | 观 | 看 | 仪 | 式 |',
  'num_samples': 120000,
  'gender': 'MALE'},
 {'id': 1917,
  'file_name': '15418680030308096157.wav',
  'raw_transcription': '罗马各地安装了数个大型电视屏幕,供人们观看仪式。',
  'transcription': '罗 马 各 地 安 装 了 数 个 大 型 电 视 屏 幕 供 人 们 观 看 仪 式',
  '_': '罗 | 马 | 各 | 地 | 安 | 装 | 了 | 数 | 个 | 大 | 型 | 电 | 视 | 屏 | 幕 | 供 | 人 | 们 | 观 | 看 | 仪 | 式 |',
  'num_samples': 108480,
  'gender': 'MALE'},
 {'id': 1917,
  'file_name': '1297049770474692918.wav',
  'raw_transcription': '罗马各地安装了数个大型电视屏幕,供人们观看仪式。',
  'transcription': '罗 马 各 地 安 装 了 数 个 大 型 电 视 屏 幕 供 人 们 观 看 仪 式',
  '_': '罗 | 马 | 各 | 地 | 安 | 装 | 了 | 数 | 个 | 大 | 型 | 电 | 视 | 屏 | 幕 | 供 | 人 | 们 | 观 | 看 | 仪 | 式 |',
  'num_samples': 173760,
  'gender': 'MALE'},
 {'id': 1664,
  'file_name': '5581030602292881199.wav',
  'raw_transcription': '搅动两种干粉使其混合,然后用干净的湿手把它们揉成一个球。',
  'transcription': '搅 动 两 种 干 粉 使 其 混 合 然 后 用 干 净 的 湿 手 把 它 们 揉 成 一 个 球',
  '_': '搅 | 动 | 两 | 种 | 干 | 粉 | 使 | 其 | 混 | 合 | 然 | 后 | 用 | 干 | 净 | 的 | 湿 | 手 | 把 | 它 | 们 | 揉 | 成 | 一 | 个 | 球 |',
  'num_samples': 126720,
  'gender': 'MALE'},
 {'id': 1664,
  'file_name': '11553758827513957267.wav',
  'raw_transcription': '搅动两种干粉使其混合,然后用干净的湿手把它们揉成一个球。',
  'transcription': '搅 动 两 种 干 粉 使 其 混 合 然 后 用 干 净 的 湿 手 把 它 们 揉 成 一 个 球',
  '_': '搅 | 动 | 两 | 种 | 干 | 粉 | 使 | 其 | 混 | 合 | 然 | 后 | 用 | 干 | 净 | 的 | 湿 | 手 | 把 | 它 | 们 | 揉 | 成 | 一 | 个 | 球 |',
  'num_samples': 182400,
  'gender': 'MALE'},
 {'id': 1664,
  'file_name': '14363423759707811902.wav',
  'raw_transcription': '搅动两种干粉使其混合,然后用干净的湿手把它们揉成一个球。',
  'transcription': '搅 动 两 种 干 粉 使 其 混 合 然 后 用 干 净 的 湿 手 把 它 们 揉 成 一 个 球',
  '_': '搅 | 动 | 两 | 种 | 干 | 粉 | 使 | 其 | 混 | 合 | 然 | 后 | 用 | 干 | 净 | 的 | 湿 | 手 | 把 | 它 | 们 | 揉 | 成 | 一 | 个 | 球 |',
  'num_samples': 216960,
  'gender': 'MALE'},
 {'id': 1997,
  'file_name': '12174980632712104184.wav',
  'raw_transcription': '然而,广泛耐药结核病在整个结核病患者群体中所占的比例似乎仍然很低;在南非,在任意特定时刻,总计 33 万人中只有 6000 人感染。',
  'transcription': '然 而 广 泛 耐 药 结 核 病 在 整 个 结 核 病 患 者 群 体 中 所 占 的 比 例 似 乎 仍 然 很 低 在 南 非 在 任 意 特 定 时 刻 总 计 33 万 人 中 只 有 6000 人 感 染',
  '_': '然 | 而 | 广 | 泛 | 耐 | 药 | 结 | 核 | 病 | 在 | 整 | 个 | 结 | 核 | 病 | 患 | 者 | 群 | 体 | 中 | 所 | 占 | 的 | 比 | 例 | 似 | 乎 | 仍 | 然 | 很 | 低 | 在 | 南 | 非 | 在 | 任 | 意 | 特 | 定 | 时 | 刻 | 总 | 计 | 3 3 | 万 | 人 | 中 | 只 | 有 | 6 0 0 0 | 人 | 感 | 染 |',
  'num_samples': 256320,
  'gender': 'MALE'},
 {'id': 1997,
  'file_name': '8287613997023350595.wav',
  'raw_transcription': '然而,广泛耐药结核病在整个结核病患者群体中所占的比例似乎仍然很低;在南非,在任意特定时刻,总计 33 万人中只有 6000 人感染。',
  'transcription': '然 而 广 泛 耐 药 结 核 病 在 整 个 结 核 病 患 者 群 体 中 所 占 的 比 例 似 乎 仍 然 很 低 在 南 非 在 任 意 特 定 时 刻 总 计 33 万 人 中 只 有 6000 人 感 染',
  '_': '然 | 而 | 广 | 泛 | 耐 | 药 | 结 | 核 | 病 | 在 | 整 | 个 | 结 | 核 | 病 | 患 | 者 | 群 | 体 | 中 | 所 | 占 | 的 | 比 | 例 | 似 | 乎 | 仍 | 然 | 很 | 低 | 在 | 南 | 非 | 在 | 任 | 意 | 特 | 定 | 时 | 刻 | 总 | 计 | 3 3 | 万 | 人 | 中 | 只 | 有 | 6 0 0 0 | 人 | 感 | 染 |',
  'num_samples': 337280,
  'gender': 'MALE'},
 {'id': 1997,
  'file_name': '18067414556024041634.wav',
  'raw_transcription': '然而,广泛耐药结核病在整个结核病患者群体中所占的比例似乎仍然很低;在南非,在任意特定时刻,总计 33 万人中只有 6000 人感染。',
  'transcription': '然 而 广 泛 耐 药 结 核 病 在 整 个 结 核 病 患 者 群 体 中 所 占 的 比 例 似 乎 仍 然 很 低 在 南 非 在 任 意 特 定 时 刻 总 计 33 万 人 中 只 有 6000 人 感 染',
  '_': '然 | 而 | 广 | 泛 | 耐 | 药 | 结 | 核 | 病 | 在 | 整 | 个 | 结 | 核 | 病 | 患 | 者 | 群 | 体 | 中 | 所 | 占 | 的 | 比 | 例 | 似 | 乎 | 仍 | 然 | 很 | 低 | 在 | 南 | 非 | 在 | 任 | 意 | 特 | 定 | 时 | 刻 | 总 | 计 | 3 3 | 万 | 人 | 中 | 只 | 有 | 6 0 0 0 | 人 | 感 | 染 |',
  'num_samples': 241920,
  'gender': 'MALE'},
 {'id': 1897,
  'file_name': '7682715438864355734.wav',
  'raw_transcription': '北部与萨赫勒地区接壤;南部和西部临大西洋。',
  'transcription': '北 部 与 萨 赫 勒 地 区 接 壤 南 部 和 西 部 临 大 西 洋',
  '_': '北 | 部 | 与 | 萨 | 赫 | 勒 | 地 | 区 | 接 | 壤 | 南 | 部 | 和 | 西 | 部 | 临 | 大 | 西 | 洋 |',
  'num_samples': 154880,
  'gender': 'MALE'},
 {'id': 1897,
  'file_name': '14607973845702576706.wav',
  'raw_transcription': '北部与萨赫勒地区接壤;南部和西部临大西洋。',
  'transcription': '北 部 与 萨 赫 勒 地 区 接 壤 南 部 和 西 部 临 大 西 洋',
  '_': '北 | 部 | 与 | 萨 | 赫 | 勒 | 地 | 区 | 接 | 壤 | 南 | 部 | 和 | 西 | 部 | 临 | 大 | 西 | 洋 |',
  'num_samples': 131840,
  'gender': 'MALE'},
 {'id': 1961,
  'file_name': '1218529094852116429.wav',
  'raw_transcription': '要说明社会化的重要性,最常用的方法之一是利用少数不幸儿童的案例。这些儿童由于被忽视、遭遇不幸或遭到故意虐待,在成长过程中没有在成年人的帮助下实现社会化。',
  'transcription': '要 说 明 社 会 化 的 重 要 性 最 常 用 的 方 法 之 一 是 利 用 少 数 不 幸 儿 童 的 案 例 这 些 儿 童 由 于 被 忽 视 遭 遇 不 幸 或 遭 到 故 意 虐 待 在 成 长 过 程 中 没 有 在 成 年 人 的 帮 助 下 实 现 社 会 化',
  '_': '要 | 说 | 明 | 社 | 会 | 化 | 的 | 重 | 要 | 性 | 最 | 常 | 用 | 的 | 方 | 法 | 之 | 一 | 是 | 利 | 用 | 少 | 数 | 不 | 幸 | 儿 | 童 | 的 | 案 | 例 | 这 | 些 | 儿 | 童 | 由 | 于 | 被 | 忽 | 视 | 遭 | 遇 | 不 | 幸 | 或 | 遭 | 到 | 故 | 意 | 虐 | 待 | 在 | 成 | 长 | 过 | 程 | 中 | 没 | 有 | 在 | 成 | 年 | 人 | 的 | 帮 | 助 | 下 | 实 | 现 | 社 | 会 | 化 |',
  'num_samples': 277440,
  'gender': 'MALE'},
 {'id': 1961,
  'file_name': '14105347165773230582.wav',
  'raw_transcription': '要说明社会化的重要性,最常用的方法之一是利用少数不幸儿童的案例。这些儿童由于被忽视、遭遇不幸或遭到故意虐待,在成长过程中没有在成年人的帮助下实现社会化。',
  'transcription': '要 说 明 社 会 化 的 重 要 性 最 常 用 的 方 法 之 一 是 利 用 少 数 不 幸 儿 童 的 案 例 这 些 儿 童 由 于 被 忽 视 遭 遇 不 幸 或 遭 到 故 意 虐 待 在 成 长 过 程 中 没 有 在 成 年 人 的 帮 助 下 实 现 社 会 化',
  '_': '要 | 说 | 明 | 社 | 会 | 化 | 的 | 重 | 要 | 性 | 最 | 常 | 用 | 的 | 方 | 法 | 之 | 一 | 是 | 利 | 用 | 少 | 数 | 不 | 幸 | 儿 | 童 | 的 | 案 | 例 | 这 | 些 | 儿 | 童 | 由 | 于 | 被 | 忽 | 视 | 遭 | 遇 | 不 | 幸 | 或 | 遭 | 到 | 故 | 意 | 虐 | 待 | 在 | 成 | 长 | 过 | 程 | 中 | 没 | 有 | 在 | 成 | 年 | 人 | 的 | 帮 | 助 | 下 | 实 | 现 | 社 | 会 | 化 |',
  'num_samples': 249600,
  'gender': 'FEMALE'},
 {'id': 1961,
  'file_name': '9302220624621035873.wav',
  'raw_transcription': '要说明社会化的重要性,最常用的方法之一是利用少数不幸儿童的案例。这些儿童由于被忽视、遭遇不幸或遭到故意虐待,在成长过程中没有在成年人的帮助下实现社会化。',
  'transcription': '要 说 明 社 会 化 的 重 要 性 最 常 用 的 方 法 之 一 是 利 用 少 数 不 幸 儿 童 的 案 例 这 些 儿 童 由 于 被 忽 视 遭 遇 不 幸 或 遭 到 故 意 虐 待 在 成 长 过 程 中 没 有 在 成 年 人 的 帮 助 下 实 现 社 会 化',
  '_': '要 | 说 | 明 | 社 | 会 | 化 | 的 | 重 | 要 | 性 | 最 | 常 | 用 | 的 | 方 | 法 | 之 | 一 | 是 | 利 | 用 | 少 | 数 | 不 | 幸 | 儿 | 童 | 的 | 案 | 例 | 这 | 些 | 儿 | 童 | 由 | 于 | 被 | 忽 | 视 | 遭 | 遇 | 不 | 幸 | 或 | 遭 | 到 | 故 | 意 | 虐 | 待 | 在 | 成 | 长 | 过 | 程 | 中 | 没 | 有 | 在 | 成 | 年 | 人 | 的 | 帮 | 助 | 下 | 实 | 现 | 社 | 会 | 化 |',
  'num_samples': 342080,
  'gender': 'MALE'},
 {'id': 1930,
  'file_name': '11294293177585826268.wav',
  'raw_transcription': '六名人质(包括儿童和老人在内)以及那些菲律宾摄影师被提前释放。',
  'transcription': '六 名 人 质 包 括 儿 童 和 老 人 在 内 以 及 那 些 菲 律 宾 摄 影 师 被 提 前 释 放',
  '_': '六 | 名 | 人 | 质 | 包 | 括 | 儿 | 童 | 和 | 老 | 人 | 在 | 内 | 以 | 及 | 那 | 些 | 菲 | 律 | 宾 | 摄 | 影 | 师 | 被 | 提 | 前 | 释 | 放 |',
  'num_samples': 135360,
  'gender': 'MALE'},
 {'id': 1930,
  'file_name': '7459037573375372374.wav',
  'raw_transcription': '六名人质(包括儿童和老人在内)以及那些菲律宾摄影师被提前释放。',
  'transcription': '六 名 人 质 包 括 儿 童 和 老 人 在 内 以 及 那 些 菲 律 宾 摄 影 师 被 提 前 释 放',
  '_': '六 | 名 | 人 | 质 | 包 | 括 | 儿 | 童 | 和 | 老 | 人 | 在 | 内 | 以 | 及 | 那 | 些 | 菲 | 律 | 宾 | 摄 | 影 | 师 | 被 | 提 | 前 | 释 | 放 |',
  'num_samples': 157440,
  'gender': 'MALE'},
 {'id': 1930,
  'file_name': '3832467713324494168.wav',
  'raw_transcription': '六名人质(包括儿童和老人在内)以及那些菲律宾摄影师被提前释放。',
  'transcription': '六 名 人 质 包 括 儿 童 和 老 人 在 内 以 及 那 些 菲 律 宾 摄 影 师 被 提 前 释 放',
  '_': '六 | 名 | 人 | 质 | 包 | 括 | 儿 | 童 | 和 | 老 | 人 | 在 | 内 | 以 | 及 | 那 | 些 | 菲 | 律 | 宾 | 摄 | 影 | 师 | 被 | 提 | 前 | 释 | 放 |',
  'num_samples': 151680,
  'gender': 'MALE'},
 {'id': 1821,
  'file_name': '5875780483277731745.wav',
  'raw_transcription': '大脑病理和行为之间的相关性可以为科学家们的研究提供支持。',
  'transcription': '大 脑 病 理 和 行 为 之 间 的 相 关 性 可 以 为 科 学 家 们 的 研 究 提 供 支 持',
  '_': '大 | 脑 | 病 | 理 | 和 | 行 | 为 | 之 | 间 | 的 | 相 | 关 | 性 | 可 | 以 | 为 | 科 | 学 | 家 | 们 | 的 | 研 | 究 | 提 | 供 | 支 | 持 |',
  'num_samples': 118080,
  'gender': 'FEMALE'},
 {'id': 1821,
  'file_name': '10694001904489787463.wav',
  'raw_transcription': '大脑病理和行为之间的相关性可以为科学家们的研究提供支持。',
  'transcription': '大 脑 病 理 和 行 为 之 间 的 相 关 性 可 以 为 科 学 家 们 的 研 究 提 供 支 持',
  '_': '大 | 脑 | 病 | 理 | 和 | 行 | 为 | 之 | 间 | 的 | 相 | 关 | 性 | 可 | 以 | 为 | 科 | 学 | 家 | 们 | 的 | 研 | 究 | 提 | 供 | 支 | 持 |',
  'num_samples': 126720,
  'gender': 'MALE'},
 {'id': 1821,
  'file_name': '16607100117315027755.wav',
  'raw_transcription': '大脑病理和行为之间的相关性可以为科学家们的研究提供支持。',
  'transcription': '大 脑 病 理 和 行 为 之 间 的 相 关 性 可 以 为 科 学 家 们 的 研 究 提 供 支 持',
  '_': '大 | 脑 | 病 | 理 | 和 | 行 | 为 | 之 | 间 | 的 | 相 | 关 | 性 | 可 | 以 | 为 | 科 | 学 | 家 | 们 | 的 | 研 | 究 | 提 | 供 | 支 | 持 |',
  'num_samples': 108480,
  'gender': 'FEMALE'},
 {'id': 1952,
  'file_name': '7602559197790126118.wav',
  'raw_transcription': '任何在高纬度地区开车或翻越山口的人,都应该考虑到可能遭遇下雪、结冰或冻结温度的情况。',
  'transcription': '任 何 在 高 纬 度 地 区 开 车 或 翻 越 山 口 的 人 都 应 该 考 虑 到 可 能 遭 遇 下 雪 结 冰 或 冻 结 温 度 的 情 况',
  '_': '任 | 何 | 在 | 高 | 纬 | 度 | 地 | 区 | 开 | 车 | 或 | 翻 | 越 | 山 | 口 | 的 | 人 | 都 | 应 | 该 | 考 | 虑 | 到 | 可 | 能 | 遭 | 遇 | 下 | 雪 | 结 | 冰 | 或 | 冻 | 结 | 温 | 度 | 的 | 情 | 况 |',
  'num_samples': 292800,
  'gender': 'MALE'},
 {'id': 1952,
  'file_name': '6006946498162292333.wav',
  'raw_transcription': '任何在高纬度地区开车或翻越山口的人,都应该考虑到可能遭遇下雪、结冰或冻结温度的情况。',
  'transcription': '任 何 在 高 纬 度 地 区 开 车 或 翻 越 山 口 的 人 都 应 该 考 虑 到 可 能 遭 遇 下 雪 结 冰 或 冻 结 温 度 的 情 况',
  '_': '任 | 何 | 在 | 高 | 纬 | 度 | 地 | 区 | 开 | 车 | 或 | 翻 | 越 | 山 | 口 | 的 | 人 | 都 | 应 | 该 | 考 | 虑 | 到 | 可 | 能 | 遭 | 遇 | 下 | 雪 | 结 | 冰 | 或 | 冻 | 结 | 温 | 度 | 的 | 情 | 况 |',
  'num_samples': 247360,
  'gender': 'MALE'},
 {'id': 1952,
  'file_name': '16921044831201319487.wav',
  'raw_transcription': '任何在高纬度地区开车或翻越山口的人,都应该考虑到可能遭遇下雪、结冰或冻结温度的情况。',
  'transcription': '任 何 在 高 纬 度 地 区 开 车 或 翻 越 山 口 的 人 都 应 该 考 虑 到 可 能 遭 遇 下 雪 结 冰 或 冻 结 温 度 的 情 况',
  '_': '任 | 何 | 在 | 高 | 纬 | 度 | 地 | 区 | 开 | 车 | 或 | 翻 | 越 | 山 | 口 | 的 | 人 | 都 | 应 | 该 | 考 | 虑 | 到 | 可 | 能 | 遭 | 遇 | 下 | 雪 | 结 | 冰 | 或 | 冻 | 结 | 温 | 度 | 的 | 情 | 况 |',
  'num_samples': 124800,
  'gender': 'FEMALE'},
 {'id': 1698,
  'file_name': '15961183399874766018.wav',
  'raw_transcription': '宇宙中的一切都由物质构成,而所有的物质都由被称为原子的微小粒子组成。',
  'transcription': '宇 宙 中 的 一 切 都 由 物 质 构 成 而 所 有 的 物 质 都 由 被 称 为 原 子 的 微 小 粒 子 组 成',
  '_': '宇 | 宙 | 中 | 的 | 一 | 切 | 都 | 由 | 物 | 质 | 构 | 成 | 而 | 所 | 有 | 的 | 物 | 质 | 都 | 由 | 被 | 称 | 为 | 原 | 子 | 的 | 微 | 小 | 粒 | 子 | 组 | 成 |',
  'num_samples': 182080,
  'gender': 'MALE'},
 {'id': 1698,
  'file_name': '17641199728519190885.wav',
  'raw_transcription': '宇宙中的一切都由物质构成,而所有的物质都由被称为原子的微小粒子组成。',
  'transcription': '宇 宙 中 的 一 切 都 由 物 质 构 成 而 所 有 的 物 质 都 由 被 称 为 原 子 的 微 小 粒 子 组 成',
  '_': '宇 | 宙 | 中 | 的 | 一 | 切 | 都 | 由 | 物 | 质 | 构 | 成 | 而 | 所 | 有 | 的 | 物 | 质 | 都 | 由 | 被 | 称 | 为 | 原 | 子 | 的 | 微 | 小 | 粒 | 子 | 组 | 成 |',
  'num_samples': 222400,
  'gender': 'MALE'},
 {'id': 1698,
  'file_name': '10544065594858743613.wav',
  'raw_transcription': '宇宙中的一切都由物质构成,而所有的物质都由被称为原子的微小粒子组成。',
  'transcription': '宇 宙 中 的 一 切 都 由 物 质 构 成 而 所 有 的 物 质 都 由 被 称 为 原 子 的 微 小 粒 子 组 成',
  '_': '宇 | 宙 | 中 | 的 | 一 | 切 | 都 | 由 | 物 | 质 | 构 | 成 | 而 | 所 | 有 | 的 | 物 | 质 | 都 | 由 | 被 | 称 | 为 | 原 | 子 | 的 | 微 | 小 | 粒 | 子 | 组 | 成 |',
  'num_samples': 155520,
  'gender': 'MALE'},
 {'id': 1736,
  'file_name': '15357884829906352500.wav',
  'raw_transcription': '罗兰多·门多萨 (Rolando Mendoza) 架起他的 M16 步枪对游客扫射。',
  'transcription': '罗 兰 多 门 多 萨 rolando mendoza 架 起 他 的 m16 步 枪 对 游 客 扫 射',
  '_': '罗 | 兰 | 多 | 门 | 多 | 萨 | r o l a n d o | m e n d o z a | 架 | 起 | 他 | 的 | m 1 6 | 步 | 枪 | 对 | 游 | 客 | 扫 | 射 |',
  'num_samples': 107520,
  'gender': 'FEMALE'},
 {'id': 1736,
  'file_name': '1221606771815724286.wav',
  'raw_transcription': '罗兰多·门多萨 (Rolando Mendoza) 架起他的 M16 步枪对游客扫射。',
  'transcription': '罗 兰 多 门 多 萨 rolando mendoza 架 起 他 的 m16 步 枪 对 游 客 扫 射',
  '_': '罗 | 兰 | 多 | 门 | 多 | 萨 | r o l a n d o | m e n d o z a | 架 | 起 | 他 | 的 | m 1 6 | 步 | 枪 | 对 | 游 | 客 | 扫 | 射 |',
  'num_samples': 105600,
  'gender': 'FEMALE'},
 {'id': 1736,
  'file_name': '16805243708514836615.wav',
  'raw_transcription': '罗兰多·门多萨 (Rolando Mendoza) 架起他的 M16 步枪对游客扫射。',
  'transcription': '罗 兰 多 门 多 萨 rolando mendoza 架 起 他 的 m16 步 枪 对 游 客 扫 射',
  '_': '罗 | 兰 | 多 | 门 | 多 | 萨 | r o l a n d o | m e n d o z a | 架 | 起 | 他 | 的 | m 1 6 | 步 | 枪 | 对 | 游 | 客 | 扫 | 射 |',
  'num_samples': 131520,
  'gender': 'MALE'},
 {'id': 1949,
  'file_name': '6777777038586489845.wav',
  'raw_transcription': '昆虫学家们用“虫子 (bug)”一词来正式称呼这一类的昆虫。',
  'transcription': '昆 虫 学 家 们 用 虫 子 bug 一 词 来 正 式 称 呼 这 一 类 的 昆 虫',
  '_': '昆 | 虫 | 学 | 家 | 们 | 用 | 虫 | 子 | b u g | 一 | 词 | 来 | 正 | 式 | 称 | 呼 | 这 | 一 | 类 | 的 | 昆 | 虫 |',
  'num_samples': 96960,
  'gender': 'FEMALE'},
 {'id': 1949,
  'file_name': '15374770057184241660.wav',
  'raw_transcription': '昆虫学家们用“虫子 (bug)”一词来正式称呼这一类的昆虫。',
  'transcription': '昆 虫 学 家 们 用 虫 子 bug 一 词 来 正 式 称 呼 这 一 类 的 昆 虫',
  '_': '昆 | 虫 | 学 | 家 | 们 | 用 | 虫 | 子 | b u g | 一 | 词 | 来 | 正 | 式 | 称 | 呼 | 这 | 一 | 类 | 的 | 昆 | 虫 |',
  'num_samples': 97920,
  'gender': 'FEMALE'},
 {'id': 1949,
  'file_name': '18312711218129227765.wav',
  'raw_transcription': '昆虫学家们用“虫子 (bug)”一词来正式称呼这一类的昆虫。',
  'transcription': '昆 虫 学 家 们 用 虫 子 bug 一 词 来 正 式 称 呼 这 一 类 的 昆 虫',
  '_': '昆 | 虫 | 学 | 家 | 们 | 用 | 虫 | 子 | b u g | 一 | 词 | 来 | 正 | 式 | 称 | 呼 | 这 | 一 | 类 | 的 | 昆 | 虫 |',
  'num_samples': 120960,
  'gender': 'MALE'},
 {'id': 1823,
  'file_name': '7683433396338143315.wav',
  'raw_transcription': '交通流量研究的是驾驶员和车辆在两点之间的运动,以及它们之间的相互作用。',
  'transcription': '交 通 流 量 研 究 的 是 驾 驶 员 和 车 辆 在 两 点 之 间 的 运 动 以 及 它 们 之 间 的 相 互 作 用',
  '_': '交 | 通 | 流 | 量 | 研 | 究 | 的 | 是 | 驾 | 驶 | 员 | 和 | 车 | 辆 | 在 | 两 | 点 | 之 | 间 | 的 | 运 | 动 | 以 | 及 | 它 | 们 | 之 | 间 | 的 | 相 | 互 | 作 | 用 |',
  'num_samples': 121920,
  'gender': 'FEMALE'},
 {'id': 1823,
  'file_name': '13102903728453206357.wav',
  'raw_transcription': '交通流量研究的是驾驶员和车辆在两点之间的运动,以及它们之间的相互作用。',
  'transcription': '交 通 流 量 研 究 的 是 驾 驶 员 和 车 辆 在 两 点 之 间 的 运 动 以 及 它 们 之 间 的 相 互 作 用',
  '_': '交 | 通 | 流 | 量 | 研 | 究 | 的 | 是 | 驾 | 驶 | 员 | 和 | 车 | 辆 | 在 | 两 | 点 | 之 | 间 | 的 | 运 | 动 | 以 | 及 | 它 | 们 | 之 | 间 | 的 | 相 | 互 | 作 | 用 |',
  'num_samples': 237760,
  'gender': 'MALE'},
 {'id': 1823,
  'file_name': '11469286276347856787.wav',
  'raw_transcription': '交通流量研究的是驾驶员和车辆在两点之间的运动,以及它们之间的相互作用。',
  'transcription': '交 通 流 量 研 究 的 是 驾 驶 员 和 车 辆 在 两 点 之 间 的 运 动 以 及 它 们 之 间 的 相 互 作 用',
  '_': '交 | 通 | 流 | 量 | 研 | 究 | 的 | 是 | 驾 | 驶 | 员 | 和 | 车 | 辆 | 在 | 两 | 点 | 之 | 间 | 的 | 运 | 动 | 以 | 及 | 它 | 们 | 之 | 间 | 的 | 相 | 互 | 作 | 用 |',
  'num_samples': 146880,
  'gender': 'MALE'},
 {'id': 1953,
  'file_name': '7303144352963046830.wav',
  'raw_transcription': '他随后被转送到剑桥的阿登布鲁克医院。',
  'transcription': '他 随 后 被 转 送 到 剑 桥 的 阿 登 布 鲁 克 医 院',
  '_': '他 | 随 | 后 | 被 | 转 | 送 | 到 | 剑 | 桥 | 的 | 阿 | 登 | 布 | 鲁 | 克 | 医 | 院 |',
  'num_samples': 124800,
  'gender': 'MALE'},
 {'id': 1953,
  'file_name': '10144930991730701959.wav',
  'raw_transcription': '他随后被转送到剑桥的阿登布鲁克医院。',
  'transcription': '他 随 后 被 转 送 到 剑 桥 的 阿 登 布 鲁 克 医 院',
  '_': '他 | 随 | 后 | 被 | 转 | 送 | 到 | 剑 | 桥 | 的 | 阿 | 登 | 布 | 鲁 | 克 | 医 | 院 |',
  'num_samples': 80640,
  'gender': 'FEMALE'},
 {'id': 1671,
  'file_name': '594585214093705152.wav',
  'raw_transcription': '国会从 2005 财年开始资助该扫黄倡议,并规定联邦调查局 (FBI) 必须指派 10 名探员专门打击成人色情。',
  'transcription': '国 会 从 2005 财 年 开 始 资 助 该 扫 黄 倡 议 并 规 定 联 邦 调 查 局 fbi 必 须 指 派 10 名 探 员 专 门 打 击 成 人 色 情',
  '_': '国 | 会 | 从 | 2 0 0 5 | 财 | 年 | 开 | 始 | 资 | 助 | 该 | 扫 | 黄 | 倡 | 议 | 并 | 规 | 定 | 联 | 邦 | 调 | 查 | 局 | f b i | 必 | 须 | 指 | 派 | 1 0 | 名 | 探 | 员 | 专 | 门 | 打 | 击 | 成 | 人 | 色 | 情 |',
  'num_samples': 226560,
  'gender': 'MALE'},
 {'id': 1671,
  'file_name': '17865784740247963652.wav',
  'raw_transcription': '国会从 2005 财年开始资助该扫黄倡议,并规定联邦调查局 (FBI) 必须指派 10 名探员专门打击成人色情。',
  'transcription': '国 会 从 2005 财 年 开 始 资 助 该 扫 黄 倡 议 并 规 定 联 邦 调 查 局 fbi 必 须 指 派 10 名 探 员 专 门 打 击 成 人 色 情',
  '_': '国 | 会 | 从 | 2 0 0 5 | 财 | 年 | 开 | 始 | 资 | 助 | 该 | 扫 | 黄 | 倡 | 议 | 并 | 规 | 定 | 联 | 邦 | 调 | 查 | 局 | f b i | 必 | 须 | 指 | 派 | 1 0 | 名 | 探 | 员 | 专 | 门 | 打 | 击 | 成 | 人 | 色 | 情 |',
  'num_samples': 165120,
  'gender': 'FEMALE'},
 {'id': 1673,
  'file_name': '6897063611136666657.wav',
  'raw_transcription': '在独立战争期间,十三个州最初根据《联邦条例》组成了弱小的中央政府(国会是其唯一的组成部分)。',
  'transcription': '在 独 立 战 争 期 间 十 三 个 州 最 初 根 据 联 邦 条 例 组 成 了 弱 小 的 中 央 政 府 国 会 是 其 唯 一 的 组 成 部 分',
  '_': '在 | 独 | 立 | 战 | 争 | 期 | 间 | 十 | 三 | 个 | 州 | 最 | 初 | 根 | 据 | 联 | 邦 | 条 | 例 | 组 | 成 | 了 | 弱 | 小 | 的 | 中 | 央 | 政 | 府 | 国 | 会 | 是 | 其 | 唯 | 一 | 的 | 组 | 成 | 部 | 分 |',
  'num_samples': 137280,
  'gender': 'FEMALE'},
 {'id': 1673,
  'file_name': '9349915113210119289.wav',
  'raw_transcription': '在独立战争期间,十三个州最初根据《联邦条例》组成了弱小的中央政府(国会是其唯一的组成部分)。',
  'transcription': '在 独 立 战 争 期 间 十 三 个 州 最 初 根 据 联 邦 条 例 组 成 了 弱 小 的 中 央 政 府 国 会 是 其 唯 一 的 组 成 部 分',
  '_': '在 | 独 | 立 | 战 | 争 | 期 | 间 | 十 | 三 | 个 | 州 | 最 | 初 | 根 | 据 | 联 | 邦 | 条 | 例 | 组 | 成 | 了 | 弱 | 小 | 的 | 中 | 央 | 政 | 府 | 国 | 会 | 是 | 其 | 唯 | 一 | 的 | 组 | 成 | 部 | 分 |',
  'num_samples': 188160,
  'gender': 'MALE'},
 {'id': 1810,
  'file_name': '7765134836545958484.wav',
  'raw_transcription': '加利福尼亚州长阿诺德·施瓦辛格签署了一项法案,禁止向未成年人出售或出租暴力电子游戏。',
  'transcription': '加 利 福 尼 亚 州 长 阿 诺 德 施 瓦 辛 格 签 署 了 一 项 法 案 禁 止 向 未 成 年 人 出 售 或 出 租 暴 力 电 子 游 戏',
  '_': '加 | 利 | 福 | 尼 | 亚 | 州 | 长 | 阿 | 诺 | 德 | 施 | 瓦 | 辛 | 格 | 签 | 署 | 了 | 一 | 项 | 法 | 案 | 禁 | 止 | 向 | 未 | 成 | 年 | 人 | 出 | 售 | 或 | 出 | 租 | 暴 | 力 | 电 | 子 | 游 | 戏 |',
  'num_samples': 247040,
  'gender': 'MALE'},
 {'id': 1810,
  'file_name': '9372807927971920449.wav',
  'raw_transcription': '加利福尼亚州长阿诺德·施瓦辛格签署了一项法案,禁止向未成年人出售或出租暴力电子游戏。',
  'transcription': '加 利 福 尼 亚 州 长 阿 诺 德 施 瓦 辛 格 签 署 了 一 项 法 案 禁 止 向 未 成 年 人 出 售 或 出 租 暴 力 电 子 游 戏',
  '_': '加 | 利 | 福 | 尼 | 亚 | 州 | 长 | 阿 | 诺 | 德 | 施 | 瓦 | 辛 | 格 | 签 | 署 | 了 | 一 | 项 | 法 | 案 | 禁 | 止 | 向 | 未 | 成 | 年 | 人 | 出 | 售 | 或 | 出 | 租 | 暴 | 力 | 电 | 子 | 游 | 戏 |',
  'num_samples': 278080,
  'gender': 'MALE'},
 {'id': 1810,
  'file_name': '5912419037743359023.wav',
  'raw_transcription': '加利福尼亚州长阿诺德·施瓦辛格签署了一项法案,禁止向未成年人出售或出租暴力电子游戏。',
  'transcription': '加 利 福 尼 亚 州 长 阿 诺 德 施 瓦 辛 格 签 署 了 一 项 法 案 禁 止 向 未 成 年 人 出 售 或 出 租 暴 力 电 子 游 戏',
  '_': '加 | 利 | 福 | 尼 | 亚 | 州 | 长 | 阿 | 诺 | 德 | 施 | 瓦 | 辛 | 格 | 签 | 署 | 了 | 一 | 项 | 法 | 案 | 禁 | 止 | 向 | 未 | 成 | 年 | 人 | 出 | 售 | 或 | 出 | 租 | 暴 | 力 | 电 | 子 | 游 | 戏 |',
  'num_samples': 200640,
  'gender': 'MALE'},
 {'id': 1761,
  'file_name': '7662962921518899342.wav',
  'raw_transcription': '两位摄影师其后顶替一位需要上洗手间的老妇。门多萨则被击毙。',
  'transcription': '两 位 摄 影 师 其 后 顶 替 一 位 需 要 上 洗 手 间 的 老 妇 门 多 萨 则 被 击 毙',
  '_': '两 | 位 | 摄 | 影 | 师 | 其 | 后 | 顶 | 替 | 一 | 位 | 需 | 要 | 上 | 洗 | 手 | 间 | 的 | 老 | 妇 | 门 | 多 | 萨 | 则 | 被 | 击 | 毙 |',
  'num_samples': 159360,
  'gender': 'MALE'},
 {'id': 1761,
  'file_name': '17577477300534206879.wav',
  'raw_transcription': '两位摄影师其后顶替一位需要上洗手间的老妇。门多萨则被击毙。',
  'transcription': '两 位 摄 影 师 其 后 顶 替 一 位 需 要 上 洗 手 间 的 老 妇 门 多 萨 则 被 击 毙',
  '_': '两 | 位 | 摄 | 影 | 师 | 其 | 后 | 顶 | 替 | 一 | 位 | 需 | 要 | 上 | 洗 | 手 | 间 | 的 | 老 | 妇 | 门 | 多 | 萨 | 则 | 被 | 击 | 毙 |',
  'num_samples': 210880,
  'gender': 'MALE'},
 {'id': 1837,
  'file_name': '11954382811553103800.wav',
  'raw_transcription': '自由派人士对重建工作的批判主要集中在把重建合同授予了视为华盛顿内部人士的这一做法。',
  'transcription': '自 由 派 人 士 对 重 建 工 作 的 批 判 主 要 集 中 在 把 重 建 合 同 授 予 了 视 为 华 盛 顿 内 部 人 士 的 这 一 做 法',
  '_': '自 | 由 | 派 | 人 | 士 | 对 | 重 | 建 | 工 | 作 | 的 | 批 | 判 | 主 | 要 | 集 | 中 | 在 | 把 | 重 | 建 | 合 | 同 | 授 | 予 | 了 | 视 | 为 | 华 | 盛 | 顿 | 内 | 部 | 人 | 士 | 的 | 这 | 一 | 做 | 法 |',
  'num_samples': 152640,
  'gender': 'FEMALE'},
 {'id': 1837,
  'file_name': '10234433636571543908.wav',
  'raw_transcription': '自由派人士对重建工作的批判主要集中在把重建合同授予了视为华盛顿内部人士的这一做法。',
  'transcription': '自 由 派 人 士 对 重 建 工 作 的 批 判 主 要 集 中 在 把 重 建 合 同 授 予 了 视 为 华 盛 顿 内 部 人 士 的 这 一 做 法',
  '_': '自 | 由 | 派 | 人 | 士 | 对 | 重 | 建 | 工 | 作 | 的 | 批 | 判 | 主 | 要 | 集 | 中 | 在 | 把 | 重 | 建 | 合 | 同 | 授 | 予 | 了 | 视 | 为 | 华 | 盛 | 顿 | 内 | 部 | 人 | 士 | 的 | 这 | 一 | 做 | 法 |',
  'num_samples': 223360,
  'gender': 'MALE'},
 {'id': 1837,
  'file_name': '2654147190567218497.wav',
  'raw_transcription': '自由派人士对重建工作的批判主要集中在把重建合同授予了视为华盛顿内部人士的这一做法。',
  'transcription': '自 由 派 人 士 对 重 建 工 作 的 批 判 主 要 集 中 在 把 重 建 合 同 授 予 了 视 为 华 盛 顿 内 部 人 士 的 这 一 做 法',
  '_': '自 | 由 | 派 | 人 | 士 | 对 | 重 | 建 | 工 | 作 | 的 | 批 | 判 | 主 | 要 | 集 | 中 | 在 | 把 | 重 | 建 | 合 | 同 | 授 | 予 | 了 | 视 | 为 | 华 | 盛 | 顿 | 内 | 部 | 人 | 士 | 的 | 这 | 一 | 做 | 法 |',
  'num_samples': 182400,
  'gender': 'MALE'},
 {'id': 1836,
  'file_name': '12447374250902265590.wav',
  'raw_transcription': '人们自古以来就知道金、银、铜等基本化学元素,因为这些元素都能以自然形态在自然界中发现,而且比较容易使用原始工具进行开采。',
  'transcription': '人 们 自 古 以 来 就 知 道 金 银 铜 等 基 本 化 学 元 素 因 为 这 些 元 素 都 能 以 自 然 形 态 在 自 然 界 中 发 现 而 且 比 较 容 易 使 用 原 始 工 具 进 行 开 采',
  '_': '人 | 们 | 自 | 古 | 以 | 来 | 就 | 知 | 道 | 金 | 银 | 铜 | 等 | 基 | 本 | 化 | 学 | 元 | 素 | 因 | 为 | 这 | 些 | 元 | 素 | 都 | 能 | 以 | 自 | 然 | 形 | 态 | 在 | 自 | 然 | 界 | 中 | 发 | 现 | 而 | 且 | 比 | 较 | 容 | 易 | 使 | 用 | 原 | 始 | 工 | 具 | 进 | 行 | 开 | 采 |',
  'num_samples': 191040,
  'gender': 'FEMALE'},
 {'id': 1836,
  'file_name': '1995661354516617046.wav',
  'raw_transcription': '人们自古以来就知道金、银、铜等基本化学元素,因为这些元素都能以自然形态在自然界中发现,而且比较容易使用原始工具进行开采。',
  'transcription': '人 们 自 古 以 来 就 知 道 金 银 铜 等 基 本 化 学 元 素 因 为 这 些 元 素 都 能 以 自 然 形 态 在 自 然 界 中 发 现 而 且 比 较 容 易 使 用 原 始 工 具 进 行 开 采',
  '_': '人 | 们 | 自 | 古 | 以 | 来 | 就 | 知 | 道 | 金 | 银 | 铜 | 等 | 基 | 本 | 化 | 学 | 元 | 素 | 因 | 为 | 这 | 些 | 元 | 素 | 都 | 能 | 以 | 自 | 然 | 形 | 态 | 在 | 自 | 然 | 界 | 中 | 发 | 现 | 而 | 且 | 比 | 较 | 容 | 易 | 使 | 用 | 原 | 始 | 工 | 具 | 进 | 行 | 开 | 采 |',
  'num_samples': 201600,
  'gender': 'MALE'},
 {'id': 1836,
  'file_name': '9320673090744975621.wav',
  'raw_transcription': '人们自古以来就知道金、银、铜等基本化学元素,因为这些元素都能以自然形态在自然界中发现,而且比较容易使用原始工具进行开采。',
  'transcription': '人 们 自 古 以 来 就 知 道 金 银 铜 等 基 本 化 学 元 素 因 为 这 些 元 素 都 能 以 自 然 形 态 在 自 然 界 中 发 现 而 且 比 较 容 易 使 用 原 始 工 具 进 行 开 采',
  '_': '人 | 们 | 自 | 古 | 以 | 来 | 就 | 知 | 道 | 金 | 银 | 铜 | 等 | 基 | 本 | 化 | 学 | 元 | 素 | 因 | 为 | 这 | 些 | 元 | 素 | 都 | 能 | 以 | 自 | 然 | 形 | 态 | 在 | 自 | 然 | 界 | 中 | 发 | 现 | 而 | 且 | 比 | 较 | 容 | 易 | 使 | 用 | 原 | 始 | 工 | 具 | 进 | 行 | 开 | 采 |',
  'num_samples': 240000,
  'gender': 'MALE'},
 {'id': 1747,
  'file_name': '17701778111296514571.wav',
  'raw_transcription': '其他摔跤选手也纷纷悼念露娜 (Luna) 。',
  'transcription': '其 他 摔 跤 选 手 也 纷 纷 悼 念 露 娜 luna',
  '_': '其 | 他 | 摔 | 跤 | 选 | 手 | 也 | 纷 | 纷 | 悼 | 念 | 露 | 娜 | l u n a |',
  'num_samples': 127680,
  'gender': 'MALE'},
 {'id': 1747,
  'file_name': '17053620110827926096.wav',
  'raw_transcription': '其他摔跤选手也纷纷悼念露娜 (Luna) 。',
  'transcription': '其 他 摔 跤 选 手 也 纷 纷 悼 念 露 娜 luna',
  '_': '其 | 他 | 摔 | 跤 | 选 | 手 | 也 | 纷 | 纷 | 悼 | 念 | 露 | 娜 | l u n a |',
  'num_samples': 106880,
  'gender': 'MALE'},
 {'id': 1830,
  'file_name': '2403432062444092968.wav',
  'raw_transcription': '执政党西南非洲人民组织 (SWAPO) 也在议会选举中保持了多数席位。',
  'transcription': '执 政 党 西 南 非 洲 人 民 组 织 swapo 也 在 议 会 选 举 中 保 持 了 多 数 席 位',
  '_': '执 | 政 | 党 | 西 | 南 | 非 | 洲 | 人 | 民 | 组 | 织 | s w a p o | 也 | 在 | 议 | 会 | 选 | 举 | 中 | 保 | 持 | 了 | 多 | 数 | 席 | 位 |',
  'num_samples': 190720,
  'gender': 'MALE'},
 {'id': 1830,
  'file_name': '5842090126088618995.wav',
  'raw_transcription': '执政党西南非洲人民组织 (SWAPO) 也在议会选举中保持了多数席位。',
  'transcription': '执 政 党 西 南 非 洲 人 民 组 织 swapo 也 在 议 会 选 举 中 保 持 了 多 数 席 位',
  '_': '执 | 政 | 党 | 西 | 南 | 非 | 洲 | 人 | 民 | 组 | 织 | s w a p o | 也 | 在 | 议 | 会 | 选 | 举 | 中 | 保 | 持 | 了 | 多 | 数 | 席 | 位 |',
  'num_samples': 162240,
  'gender': 'MALE'},
 {'id': 1830,
  'file_name': '10147383166642115307.wav',
  'raw_transcription': '执政党西南非洲人民组织 (SWAPO) 也在议会选举中保持了多数席位。',
  'transcription': '执 政 党 西 南 非 洲 人 民 组 织 swapo 也 在 议 会 选 举 中 保 持 了 多 数 席 位',
  '_': '执 | 政 | 党 | 西 | 南 | 非 | 洲 | 人 | 民 | 组 | 织 | s w a p o | 也 | 在 | 议 | 会 | 选 | 举 | 中 | 保 | 持 | 了 | 多 | 数 | 席 | 位 |',
  'num_samples': 101760,
  'gender': 'FEMALE'},
 {'id': 1727,
  'file_name': '12527496037175473680.wav',
  'raw_transcription': '野孩子在被抛弃或离家出走之前,可能经历过严重的儿童虐待或创伤。',
  'transcription': '野 孩 子 在 被 抛 弃 或 离 家 出 走 之 前 可 能 经 历 过 严 重 的 儿 童 虐 待 或 创 伤',
  '_': '野 | 孩 | 子 | 在 | 被 | 抛 | 弃 | 或 | 离 | 家 | 出 | 走 | 之 | 前 | 可 | 能 | 经 | 历 | 过 | 严 | 重 | 的 | 儿 | 童 | 虐 | 待 | 或 | 创 | 伤 |',
  'num_samples': 176640,
  'gender': 'MALE'},
 {'id': 1727,
  'file_name': '14542662100868036921.wav',
  'raw_transcription': '野孩子在被抛弃或离家出走之前,可能经历过严重的儿童虐待或创伤。',
  'transcription': '野 孩 子 在 被 抛 弃 或 离 家 出 走 之 前 可 能 经 历 过 严 重 的 儿 童 虐 待 或 创 伤',
  '_': '野 | 孩 | 子 | 在 | 被 | 抛 | 弃 | 或 | 离 | 家 | 出 | 走 | 之 | 前 | 可 | 能 | 经 | 历 | 过 | 严 | 重 | 的 | 儿 | 童 | 虐 | 待 | 或 | 创 | 伤 |',
  'num_samples': 221760,
  'gender': 'MALE'},
 {'id': 1727,
  'file_name': '8611402946406642499.wav',
  'raw_transcription': '野孩子在被抛弃或离家出走之前,可能经历过严重的儿童虐待或创伤。',
  'transcription': '野 孩 子 在 被 抛 弃 或 离 家 出 走 之 前 可 能 经 历 过 严 重 的 儿 童 虐 待 或 创 伤',
  '_': '野 | 孩 | 子 | 在 | 被 | 抛 | 弃 | 或 | 离 | 家 | 出 | 走 | 之 | 前 | 可 | 能 | 经 | 历 | 过 | 严 | 重 | 的 | 儿 | 童 | 虐 | 待 | 或 | 创 | 伤 |',
  'num_samples': 189760,
  'gender': 'MALE'},
 {'id': 1663,
  'file_name': '17125746560393607835.wav',
  'raw_transcription': '智利首选登山目的地科茶莫山谷 (Cochamó Valley) 被称为南美洲的优胜美地 (Yosemite),这里有各式各样的花岗岩大石壁和峭壁。',
  'transcription': '智利首选登山目的地科茶莫山谷 cochamó valley 被称为南美洲的优胜美地 yosemite这里有各式各样的花岗岩大石壁和峭壁',
  '_': '智 利 首 选 登 山 目 的 地 科 茶 莫 山 谷 | c o c h a m ó | v a l l e y | 被 称 为 南 美 洲 的 优 胜 美 地 | y o s e m i t e 这 里 有 各 式 各 样 的 花 岗 岩 大 石 壁 和 峭 壁 |',
  'num_samples': 214080,
  'gender': 'MALE'},
 {'id': 1663,
  'file_name': '733642182168918200.wav',
  'raw_transcription': '智利首选登山目的地科茶莫山谷 (Cochamó Valley) 被称为南美洲的优胜美地 (Yosemite),这里有各式各样的花岗岩大石壁和峭壁。',
  'transcription': '智利首选登山目的地科茶莫山谷 cochamó valley 被称为南美洲的优胜美地 yosemite这里有各式各样的花岗岩大石壁和峭壁',
  '_': '智 利 首 选 登 山 目 的 地 科 茶 莫 山 谷 | c o c h a m ó | v a l l e y | 被 称 为 南 美 洲 的 优 胜 美 地 | y o s e m i t e 这 里 有 各 式 各 样 的 花 岗 岩 大 石 壁 和 峭 壁 |',
  'num_samples': 189120,
  'gender': 'MALE'},
 {'id': 1857,
  'file_name': '1306812362383056896.wav',
  'raw_transcription': '他补充道,“然而,他们不应该被要求承担超出其发展阶段、责任和能力范围的义务。”',
  'transcription': '他 补 充 道 然 而 他 们 不 应 该 被 要 求 承 担 超 出 其 发 展 阶 段 责 任 和 能 力 范 围 的 义 务',
  '_': '他 | 补 | 充 | 道 | 然 | 而 | 他 | 们 | 不 | 应 | 该 | 被 | 要 | 求 | 承 | 担 | 超 | 出 | 其 | 发 | 展 | 阶 | 段 | 责 | 任 | 和 | 能 | 力 | 范 | 围 | 的 | 义 | 务 |',
  'num_samples': 275200,
  'gender': 'MALE'},
 {'id': 1857,
  'file_name': '17731746061944982790.wav',
  'raw_transcription': '他补充道,“然而,他们不应该被要求承担超出其发展阶段、责任和能力范围的义务。”',
  'transcription': '他 补 充 道 然 而 他 们 不 应 该 被 要 求 承 担 超 出 其 发 展 阶 段 责 任 和 能 力 范 围 的 义 务',
  '_': '他 | 补 | 充 | 道 | 然 | 而 | 他 | 们 | 不 | 应 | 该 | 被 | 要 | 求 | 承 | 担 | 超 | 出 | 其 | 发 | 展 | 阶 | 段 | 责 | 任 | 和 | 能 | 力 | 范 | 围 | 的 | 义 | 务 |',
  'num_samples': 293440,
  'gender': 'MALE'},
 {'id': 1857,
  'file_name': '17117723778418727451.wav',
  'raw_transcription': '他补充道,“然而,他们不应该被要求承担超出其发展阶段、责任和能力范围的义务。”',
  'transcription': '他 补 充 道 然 而 他 们 不 应 该 被 要 求 承 担 超 出 其 发 展 阶 段 责 任 和 能 力 范 围 的 义 务',
  '_': '他 | 补 | 充 | 道 | 然 | 而 | 他 | 们 | 不 | 应 | 该 | 被 | 要 | 求 | 承 | 担 | 超 | 出 | 其 | 发 | 展 | 阶 | 段 | 责 | 任 | 和 | 能 | 力 | 范 | 围 | 的 | 义 | 务 |',
  'num_samples': 169600,
  'gender': 'MALE'},
 {'id': 1783,
  'file_name': '7774911207116652289.wav',
  'raw_transcription': '区域性和季节性的恶劣天气现象包括暴风雪、雪暴、冰暴和沙尘暴等。',
  'transcription': '区 域 性 和 季 节 性 的 恶 劣 天 气 现 象 包 括 暴 风 雪 雪 暴 冰 暴 和 沙 尘 暴 等',
  '_': '区 | 域 | 性 | 和 | 季 | 节 | 性 | 的 | 恶 | 劣 | 天 | 气 | 现 | 象 | 包 | 括 | 暴 | 风 | 雪 | 雪 | 暴 | 冰 | 暴 | 和 | 沙 | 尘 | 暴 | 等 |',
  'num_samples': 149760,
  'gender': 'MALE'},
 {'id': 1783,
  'file_name': '1589338390833103167.wav',
  'raw_transcription': '区域性和季节性的恶劣天气现象包括暴风雪、雪暴、冰暴和沙尘暴等。',
  'transcription': '区 域 性 和 季 节 性 的 恶 劣 天 气 现 象 包 括 暴 风 雪 雪 暴 冰 暴 和 沙 尘 暴 等',
  '_': '区 | 域 | 性 | 和 | 季 | 节 | 性 | 的 | 恶 | 劣 | 天 | 气 | 现 | 象 | 包 | 括 | 暴 | 风 | 雪 | 雪 | 暴 | 冰 | 暴 | 和 | 沙 | 尘 | 暴 | 等 |',
  'num_samples': 160320,
  'gender': 'MALE'},
 {'id': 1742,
  'file_name': '11354026069894527896.wav',
  'raw_transcription': '香港岛是香港地区的代名词,也是众多游客心目中的焦点所在。',
  'transcription': '香 港 岛 是 香 港 地 区 的 代 名 词 也 是 众 多 游 客 心 目 中 的 焦 点 所 在',
  '_': '香 | 港 | 岛 | 是 | 香 | 港 | 地 | 区 | 的 | 代 | 名 | 词 | 也 | 是 | 众 | 多 | 游 | 客 | 心 | 目 | 中 | 的 | 焦 | 点 | 所 | 在 |',
  'num_samples': 178560,
  'gender': 'MALE'},
 {'id': 1742,
  'file_name': '4101923403990216517.wav',
  'raw_transcription': '香港岛是香港地区的代名词,也是众多游客心目中的焦点所在。',
  'transcription': '香 港 岛 是 香 港 地 区 的 代 名 词 也 是 众 多 游 客 心 目 中 的 焦 点 所 在',
  '_': '香 | 港 | 岛 | 是 | 香 | 港 | 地 | 区 | 的 | 代 | 名 | 词 | 也 | 是 | 众 | 多 | 游 | 客 | 心 | 目 | 中 | 的 | 焦 | 点 | 所 | 在 |',
  'num_samples': 226240,
  'gender': 'MALE'},
 {'id': 1742,
  'file_name': '17564154424245082678.wav',
  'raw_transcription': '香港岛是香港地区的代名词,也是众多游客心目中的焦点所在。',
  'transcription': '香 港 岛 是 香 港 地 区 的 代 名 词 也 是 众 多 游 客 心 目 中 的 焦 点 所 在',
  '_': '香 | 港 | 岛 | 是 | 香 | 港 | 地 | 区 | 的 | 代 | 名 | 词 | 也 | 是 | 众 | 多 | 游 | 客 | 心 | 目 | 中 | 的 | 焦 | 点 | 所 | 在 |',
  'num_samples': 141120,
  'gender': 'MALE'},
 {'id': 1927,
  'file_name': '9822698200563264022.wav',
  'raw_transcription': '《天使》(2006) 将连续体方案解释为可以帮助组织达到更高绩效水平的一种方法。',
  'transcription': '天 使 2006 将 连 续 体 方 案 解 释 为 可 以 帮 助 组 织 达 到 更 高 绩 效 水 平 的 一 种 方 法',
  '_': '天 | 使 | 2 0 0 6 | 将 | 连 | 续 | 体 | 方 | 案 | 解 | 释 | 为 | 可 | 以 | 帮 | 助 | 组 | 织 | 达 | 到 | 更 | 高 | 绩 | 效 | 水 | 平 | 的 | 一 | 种 | 方 | 法 |',
  'num_samples': 201600,
  'gender': 'MALE'},
 {'id': 1927,
  'file_name': '15052299507121145030.wav',
  'raw_transcription': '《天使》(2006) 将连续体方案解释为可以帮助组织达到更高绩效水平的一种方法。',
  'transcription': '天 使 2006 将 连 续 体 方 案 解 释 为 可 以 帮 助 组 织 达 到 更 高 绩 效 水 平 的 一 种 方 法',
  '_': '天 | 使 | 2 0 0 6 | 将 | 连 | 续 | 体 | 方 | 案 | 解 | 释 | 为 | 可 | 以 | 帮 | 助 | 组 | 织 | 达 | 到 | 更 | 高 | 绩 | 效 | 水 | 平 | 的 | 一 | 种 | 方 | 法 |',
  'num_samples': 173760,
  'gender': 'MALE'},
 {'id': 1927,
  'file_name': '15597759437374066001.wav',
  'raw_transcription': '《天使》(2006) 将连续体方案解释为可以帮助组织达到更高绩效水平的一种方法。',
  'transcription': '天 使 2006 将 连 续 体 方 案 解 释 为 可 以 帮 助 组 织 达 到 更 高 绩 效 水 平 的 一 种 方 法',
  '_': '天 | 使 | 2 0 0 6 | 将 | 连 | 续 | 体 | 方 | 案 | 解 | 释 | 为 | 可 | 以 | 帮 | 助 | 组 | 织 | 达 | 到 | 更 | 高 | 绩 | 效 | 水 | 平 | 的 | 一 | 种 | 方 | 法 |',
  'num_samples': 148800,
  'gender': 'MALE'},
 {'id': 1982,
  'file_name': '2002119703790174212.wav',
  'raw_transcription': '女性:建议无论实际婚姻状况如何,所有女性游客都应说自己已婚。',
  'transcription': '女 性 建 议 无 论 实 际 婚 姻 状 况 如 何 所 有 女 性 游 客 都 应 说 自 己 已 婚',
  '_': '女 | 性 | 建 | 议 | 无 | 论 | 实 | 际 | 婚 | 姻 | 状 | 况 | 如 | 何 | 所 | 有 | 女 | 性 | 游 | 客 | 都 | 应 | 说 | 自 | 己 | 已 | 婚 |',
  'num_samples': 209920,
  'gender': 'MALE'},
 {'id': 1982,
  'file_name': '11844924614009214850.wav',
  'raw_transcription': '女性:建议无论实际婚姻状况如何,所有女性游客都应说自己已婚。',
  'transcription': '女 性 建 议 无 论 实 际 婚 姻 状 况 如 何 所 有 女 性 游 客 都 应 说 自 己 已 婚',
  '_': '女 | 性 | 建 | 议 | 无 | 论 | 实 | 际 | 婚 | 姻 | 状 | 况 | 如 | 何 | 所 | 有 | 女 | 性 | 游 | 客 | 都 | 应 | 说 | 自 | 己 | 已 | 婚 |',
  'num_samples': 192000,
  'gender': 'MALE'},
 {'id': 1908,
  'file_name': '9674297047338995817.wav',
  'raw_transcription': '这是区分某些动词和宾语的一个重要方法。',
  'transcription': '这 是 区 分 某 些 动 词 和 宾 语 的 一 个 重 要 方 法',
  '_': '这 | 是 | 区 | 分 | 某 | 些 | 动 | 词 | 和 | 宾 | 语 | 的 | 一 | 个 | 重 | 要 | 方 | 法 |',
  'num_samples': 69120,
  'gender': 'FEMALE'},
 {'id': 1908,
  'file_name': '18110902749850944451.wav',
  'raw_transcription': '这是区分某些动词和宾语的一个重要方法。',
  'transcription': '这 是 区 分 某 些 动 词 和 宾 语 的 一 个 重 要 方 法',
  '_': '这 | 是 | 区 | 分 | 某 | 些 | 动 | 词 | 和 | 宾 | 语 | 的 | 一 | 个 | 重 | 要 | 方 | 法 |',
  'num_samples': 68160,
  'gender': 'FEMALE'},
 {'id': 1908,
  'file_name': '17627527975254527626.wav',
  'raw_transcription': '这是区分某些动词和宾语的一个重要方法。',
  'transcription': '这 是 区 分 某 些 动 词 和 宾 语 的 一 个 重 要 方 法',
  '_': '这 | 是 | 区 | 分 | 某 | 些 | 动 | 词 | 和 | 宾 | 语 | 的 | 一 | 个 | 重 | 要 | 方 | 法 |',
  'num_samples': 161920,
  'gender': 'MALE'},
 {'id': 1680,
  'file_name': '3685895179043714973.wav',
  'raw_transcription': '老虎是全能运动员,它会攀爬(虽然攀爬能力不是很强)、游泳、跳远,拉力能达到人类大力士的五倍。',
  'transcription': '老 虎 是 全 能 运 动 员 它 会 攀 爬 虽 然 攀 爬 能 力 不 是 很 强 游 泳 跳 远 拉 力 能 达 到 人 类 大 力 士 的 五 倍',
  '_': '老 | 虎 | 是 | 全 | 能 | 运 | 动 | 员 | 它 | 会 | 攀 | 爬 | 虽 | 然 | 攀 | 爬 | 能 | 力 | 不 | 是 | 很 | 强 | 游 | 泳 | 跳 | 远 | 拉 | 力 | 能 | 达 | 到 | 人 | 类 | 大 | 力 | 士 | 的 | 五 | 倍 |',
  'num_samples': 227200,
  'gender': 'MALE'},
 {'id': 1680,
  'file_name': '1746282758847179252.wav',
  'raw_transcription': '老虎是全能运动员,它会攀爬(虽然攀爬能力不是很强)、游泳、跳远,拉力能达到人类大力士的五倍。',
  'transcription': '老 虎 是 全 能 运 动 员 它 会 攀 爬 虽 然 攀 爬 能 力 不 是 很 强 游 泳 跳 远 拉 力 能 达 到 人 类 大 力 士 的 五 倍',
  '_': '老 | 虎 | 是 | 全 | 能 | 运 | 动 | 员 | 它 | 会 | 攀 | 爬 | 虽 | 然 | 攀 | 爬 | 能 | 力 | 不 | 是 | 很 | 强 | 游 | 泳 | 跳 | 远 | 拉 | 力 | 能 | 达 | 到 | 人 | 类 | 大 | 力 | 士 | 的 | 五 | 倍 |',
  'num_samples': 273280,
  'gender': 'MALE'},
 {'id': 1680,
  'file_name': '13300750670399228150.wav',
  'raw_transcription': '老虎是全能运动员,它会攀爬(虽然攀爬能力不是很强)、游泳、跳远,拉力能达到人类大力士的五倍。',
  'transcription': '老 虎 是 全 能 运 动 员 它 会 攀 爬 虽 然 攀 爬 能 力 不 是 很 强 游 泳 跳 远 拉 力 能 达 到 人 类 大 力 士 的 五 倍',
  '_': '老 | 虎 | 是 | 全 | 能 | 运 | 动 | 员 | 它 | 会 | 攀 | 爬 | 虽 | 然 | 攀 | 爬 | 能 | 力 | 不 | 是 | 很 | 强 | 游 | 泳 | 跳 | 远 | 拉 | 力 | 能 | 达 | 到 | 人 | 类 | 大 | 力 | 士 | 的 | 五 | 倍 |',
  'num_samples': 250560,
  'gender': 'MALE'},
 {'id': 1871,
  'file_name': '10481669967989866997.wav',
  'raw_transcription': '在中东温暖的气候中,房子并不是多重要。',
  'transcription': '在 中 东 温 暖 的 气 候 中 房 子 并 不 是 多 重 要',
  '_': '在 | 中 | 东 | 温 | 暖 | 的 | 气 | 候 | 中 | 房 | 子 | 并 | 不 | 是 | 多 | 重 | 要 |',
  'num_samples': 111360,
  'gender': 'MALE'},
 {'id': 1871,
  'file_name': '1105659766402365181.wav',
  'raw_transcription': '在中东温暖的气候中,房子并不是多重要。',
  'transcription': '在 中 东 温 暖 的 气 候 中 房 子 并 不 是 多 重 要',
  '_': '在 | 中 | 东 | 温 | 暖 | 的 | 气 | 候 | 中 | 房 | 子 | 并 | 不 | 是 | 多 | 重 | 要 |',
  'num_samples': 115200,
  'gender': 'MALE'},
 {'id': 1871,
  'file_name': '3952817111418833045.wav',
  'raw_transcription': '在中东温暖的气候中,房子并不是多重要。',
  'transcription': '在 中 东 温 暖 的 气 候 中 房 子 并 不 是 多 重 要',
  '_': '在 | 中 | 东 | 温 | 暖 | 的 | 气 | 候 | 中 | 房 | 子 | 并 | 不 | 是 | 多 | 重 | 要 |',
  'num_samples': 184000,
  'gender': 'MALE'},
 {'id': 1690,
  'file_name': '3819321501973613113.wav',
  'raw_transcription': '我们同意美国奥委会的声明,与其吊销执照,不如在我们组织内部继续推进有意义的变革,可能更有利于维护运动员和俱乐部的利益及其运动。',
  'transcription': '我 们 同 意 美 国 奥 委 会 的 声 明 与 其 吊 销 执 照 不 如 在 我 们 组 织 内 部 继 续 推 进 有 意 义 的 变 革 可 能 更 有 利 于 维 护 运 动 员 和 俱 乐 部 的 利 益 及 其 运 动',
  '_': '我 | 们 | 同 | 意 | 美 | 国 | 奥 | 委 | 会 | 的 | 声 | 明 | 与 | 其 | 吊 | 销 | 执 | 照 | 不 | 如 | 在 | 我 | 们 | 组 | 织 | 内 | 部 | 继 | 续 | 推 | 进 | 有 | 意 | 义 | 的 | 变 | 革 | 可 | 能 | 更 | 有 | 利 | 于 | 维 | 护 | 运 | 动 | 员 | 和 | 俱 | 乐 | 部 | 的 | 利 | 益 | 及 | 其 | 运 | 动 |',
  'num_samples': 321280,
  'gender': 'MALE'},
 {'id': 1690,
  'file_name': '489778078127797908.wav',
  'raw_transcription': '我们同意美国奥委会的声明,与其吊销执照,不如在我们组织内部继续推进有意义的变革,可能更有利于维护运动员和俱乐部的利益及其运动。',
  'transcription': '我 们 同 意 美 国 奥 委 会 的 声 明 与 其 吊 销 执 照 不 如 在 我 们 组 织 内 部 继 续 推 进 有 意 义 的 变 革 可 能 更 有 利 于 维 护 运 动 员 和 俱 乐 部 的 利 益 及 其 运 动',
  '_': '我 | 们 | 同 | 意 | 美 | 国 | 奥 | 委 | 会 | 的 | 声 | 明 | 与 | 其 | 吊 | 销 | 执 | 照 | 不 | 如 | 在 | 我 | 们 | 组 | 织 | 内 | 部 | 继 | 续 | 推 | 进 | 有 | 意 | 义 | 的 | 变 | 革 | 可 | 能 | 更 | 有 | 利 | 于 | 维 | 护 | 运 | 动 | 员 | 和 | 俱 | 乐 | 部 | 的 | 利 | 益 | 及 | 其 | 运 | 动 |',
  'num_samples': 253440,
  'gender': 'MALE'},
 {'id': 1690,
  'file_name': '11881689509934687775.wav',
  'raw_transcription': '我们同意美国奥委会的声明,与其吊销执照,不如在我们组织内部继续推进有意义的变革,可能更有利于维护运动员和俱乐部的利益及其运动。',
  'transcription': '我 们 同 意 美 国 奥 委 会 的 声 明 与 其 吊 销 执 照 不 如 在 我 们 组 织 内 部 继 续 推 进 有 意 义 的 变 革 可 能 更 有 利 于 维 护 运 动 员 和 俱 乐 部 的 利 益 及 其 运 动',
  '_': '我 | 们 | 同 | 意 | 美 | 国 | 奥 | 委 | 会 | 的 | 声 | 明 | 与 | 其 | 吊 | 销 | 执 | 照 | 不 | 如 | 在 | 我 | 们 | 组 | 织 | 内 | 部 | 继 | 续 | 推 | 进 | 有 | 意 | 义 | 的 | 变 | 革 | 可 | 能 | 更 | 有 | 利 | 于 | 维 | 护 | 运 | 动 | 员 | 和 | 俱 | 乐 | 部 | 的 | 利 | 益 | 及 | 其 | 运 | 动 |',
  'num_samples': 226560,
  'gender': 'MALE'},
 {'id': 1880,
  'file_name': '15945724607973022703.wav',
  'raw_transcription': '因此,铅笔一问世,就成了许多人的心头好。',
  'transcription': '因 此 铅 笔 一 问 世 就 成 了 许 多 人 的 心 头 好',
  '_': '因 | 此 | 铅 | 笔 | 一 | 问 | 世 | 就 | 成 | 了 | 许 | 多 | 人 | 的 | 心 | 头 | 好 |',
  'num_samples': 216640,
  'gender': 'MALE'},
 {'id': 1880,
  'file_name': '15325907659849122847.wav',
  'raw_transcription': '因此,铅笔一问世,就成了许多人的心头好。',
  'transcription': '因 此 铅 笔 一 问 世 就 成 了 许 多 人 的 心 头 好',
  '_': '因 | 此 | 铅 | 笔 | 一 | 问 | 世 | 就 | 成 | 了 | 许 | 多 | 人 | 的 | 心 | 头 | 好 |',
  'num_samples': 116160,
  'gender': 'MALE'},
 {'id': 1880,
  'file_name': '10885647054729330005.wav',
  'raw_transcription': '因此,铅笔一问世,就成了许多人的心头好。',
  'transcription': '因 此 铅 笔 一 问 世 就 成 了 许 多 人 的 心 头 好',
  '_': '因 | 此 | 铅 | 笔 | 一 | 问 | 世 | 就 | 成 | 了 | 许 | 多 | 人 | 的 | 心 | 头 | 好 |',
  'num_samples': 158400,
  'gender': 'MALE'},
 {'id': 1755,
  'file_name': '3007592216542538483.wav',
  'raw_transcription': '一枚炸弹在总督办公室外爆炸。',
  'transcription': '一 枚 炸 弹 在 总 督 办 公 室 外 爆 炸',
  '_': '一 | 枚 | 炸 | 弹 | 在 | 总 | 督 | 办 | 公 | 室 | 外 | 爆 | 炸 |',
  'num_samples': 150400,
  'gender': 'MALE'},
 {'id': 1755,
  'file_name': '2778309167184346148.wav',
  'raw_transcription': '一枚炸弹在总督办公室外爆炸。',
  'transcription': '一 枚 炸 弹 在 总 督 办 公 室 外 爆 炸',
  '_': '一 | 枚 | 炸 | 弹 | 在 | 总 | 督 | 办 | 公 | 室 | 外 | 爆 | 炸 |',
  'num_samples': 115200,
  'gender': 'MALE'},
 {'id': 1755,
  'file_name': '530194734552081786.wav',
  'raw_transcription': '一枚炸弹在总督办公室外爆炸。',
  'transcription': '一 枚 炸 弹 在 总 督 办 公 室 外 爆 炸',
  '_': '一 | 枚 | 炸 | 弹 | 在 | 总 | 督 | 办 | 公 | 室 | 外 | 爆 | 炸 |',
  'num_samples': 179840,
  'gender': 'MALE'},
 {'id': 1750,
  'file_name': '14192547969741993601.wav',
  'raw_transcription': '这一发现也有助于深入了解鸟类羽毛的进化。',
  'transcription': '这 一 发 现 也 有 助 于 深 入 了 解 鸟 类 羽 毛 的 进 化',
  '_': '这 | 一 | 发 | 现 | 也 | 有 | 助 | 于 | 深 | 入 | 了 | 解 | 鸟 | 类 | 羽 | 毛 | 的 | 进 | 化 |',
  'num_samples': 129280,
  'gender': 'MALE'},
 {'id': 1750,
  'file_name': '17228529771182951628.wav',
  'raw_transcription': '这一发现也有助于深入了解鸟类羽毛的进化。',
  'transcription': '这 一 发 现 也 有 助 于 深 入 了 解 鸟 类 羽 毛 的 进 化',
  '_': '这 | 一 | 发 | 现 | 也 | 有 | 助 | 于 | 深 | 入 | 了 | 解 | 鸟 | 类 | 羽 | 毛 | 的 | 进 | 化 |',
  'num_samples': 172800,
  'gender': 'MALE'},
 {'id': 1750,
  'file_name': '5993706091846256917.wav',
  'raw_transcription': '这一发现也有助于深入了解鸟类羽毛的进化。',
  'transcription': '这 一 发 现 也 有 助 于 深 入 了 解 鸟 类 羽 毛 的 进 化',
  '_': '这 | 一 | 发 | 现 | 也 | 有 | 助 | 于 | 深 | 入 | 了 | 解 | 鸟 | 类 | 羽 | 毛 | 的 | 进 | 化 |',
  'num_samples': 82560,
  'gender': 'FEMALE'},
 {'id': 1876,
  'file_name': '4562628898365117460.wav',
  'raw_transcription': '北马里亚纳应急管理办公室表示,据报告国内没有造成灾害损失。',
  'transcription': '北 马 里 亚 纳 应 急 管 理 办 公 室 表 示 据 报 告 国 内 没 有 造 成 灾 害 损 失',
  '_': '北 | 马 | 里 | 亚 | 纳 | 应 | 急 | 管 | 理 | 办 | 公 | 室 | 表 | 示 | 据 | 报 | 告 | 国 | 内 | 没 | 有 | 造 | 成 | 灾 | 害 | 损 | 失 |',
  'num_samples': 167040,
  'gender': 'MALE'},
 {'id': 1968,
  'file_name': '3270917576771911188.wav',
  'raw_transcription': '有些邮轮在宣传手册上以德国柏林为亮点。正如从上面地图中看到的那样,柏林并没有靠近大海的地方,而且游船价格并不包括游览这座城市的费用。',
  'transcription': '有 些 邮 轮 在 宣 传 手 册 上 以 德 国 柏 林 为 亮 点 正 如 从 上 面 地 图 中 看 到 的 那 样 柏 林 并 没 有 靠 近 大 海 的 地 方 而 且 游 船 价 格 并 不 包 括 游 览 这 座 城 市 的 费 用',
  '_': '有 | 些 | 邮 | 轮 | 在 | 宣 | 传 | 手 | 册 | 上 | 以 | 德 | 国 | 柏 | 林 | 为 | 亮 | 点 | 正 | 如 | 从 | 上 | 面 | 地 | 图 | 中 | 看 | 到 | 的 | 那 | 样 | 柏 | 林 | 并 | 没 | 有 | 靠 | 近 | 大 | 海 | 的 | 地 | 方 | 而 | 且 | 游 | 船 | 价 | 格 | 并 | 不 | 包 | 括 | 游 | 览 | 这 | 座 | 城 | 市 | 的 | 费 | 用 |',
  'num_samples': 259200,
  'gender': 'MALE'},
 {'id': 1968,
  'file_name': '15460176488203605180.wav',
  'raw_transcription': '有些邮轮在宣传手册上以德国柏林为亮点。正如从上面地图中看到的那样,柏林并没有靠近大海的地方,而且游船价格并不包括游览这座城市的费用。',
  'transcription': '有 些 邮 轮 在 宣 传 手 册 上 以 德 国 柏 林 为 亮 点 正 如 从 上 面 地 图 中 看 到 的 那 样 柏 林 并 没 有 靠 近 大 海 的 地 方 而 且 游 船 价 格 并 不 包 括 游 览 这 座 城 市 的 费 用',
  '_': '有 | 些 | 邮 | 轮 | 在 | 宣 | 传 | 手 | 册 | 上 | 以 | 德 | 国 | 柏 | 林 | 为 | 亮 | 点 | 正 | 如 | 从 | 上 | 面 | 地 | 图 | 中 | 看 | 到 | 的 | 那 | 样 | 柏 | 林 | 并 | 没 | 有 | 靠 | 近 | 大 | 海 | 的 | 地 | 方 | 而 | 且 | 游 | 船 | 价 | 格 | 并 | 不 | 包 | 括 | 游 | 览 | 这 | 座 | 城 | 市 | 的 | 费 | 用 |',
  'num_samples': 193920,
  'gender': 'FEMALE'},
 {'id': 1968,
  'file_name': '6226414565761909244.wav',
  'raw_transcription': '有些邮轮在宣传手册上以德国柏林为亮点。正如从上面地图中看到的那样,柏林并没有靠近大海的地方,而且游船价格并不包括游览这座城市的费用。',
  'transcription': '有 些 邮 轮 在 宣 传 手 册 上 以 德 国 柏 林 为 亮 点 正 如 从 上 面 地 图 中 看 到 的 那 样 柏 林 并 没 有 靠 近 大 海 的 地 方 而 且 游 船 价 格 并 不 包 括 游 览 这 座 城 市 的 费 用',
  '_': '有 | 些 | 邮 | 轮 | 在 | 宣 | 传 | 手 | 册 | 上 | 以 | 德 | 国 | 柏 | 林 | 为 | 亮 | 点 | 正 | 如 | 从 | 上 | 面 | 地 | 图 | 中 | 看 | 到 | 的 | 那 | 样 | 柏 | 林 | 并 | 没 | 有 | 靠 | 近 | 大 | 海 | 的 | 地 | 方 | 而 | 且 | 游 | 船 | 价 | 格 | 并 | 不 | 包 | 括 | 游 | 览 | 这 | 座 | 城 | 市 | 的 | 费 | 用 |',
  'num_samples': 251520,
  'gender': 'MALE'},
 {'id': 1888,
  'file_name': '12625997379895833919.wav',
  'raw_transcription': '重返家园的冲击比文化冲击来得更快(蜜月期更短),持续时间更长,也可能更严重。',
  'transcription': '重 返 家 园 的 冲 击 比 文 化 冲 击 来 得 更 快 蜜 月 期 更 短 持 续 时 间 更 长 也 可 能 更 严 重',
  '_': '重 | 返 | 家 | 园 | 的 | 冲 | 击 | 比 | 文 | 化 | 冲 | 击 | 来 | 得 | 更 | 快 | 蜜 | 月 | 期 | 更 | 短 | 持 | 续 | 时 | 间 | 更 | 长 | 也 | 可 | 能 | 更 | 严 | 重 |',
  'num_samples': 171840,
  'gender': 'MALE'},
 {'id': 1888,
  'file_name': '15420115247903262471.wav',
  'raw_transcription': '重返家园的冲击比文化冲击来得更快(蜜月期更短),持续时间更长,也可能更严重。',
  'transcription': '重 返 家 园 的 冲 击 比 文 化 冲 击 来 得 更 快 蜜 月 期 更 短 持 续 时 间 更 长 也 可 能 更 严 重',
  '_': '重 | 返 | 家 | 园 | 的 | 冲 | 击 | 比 | 文 | 化 | 冲 | 击 | 来 | 得 | 更 | 快 | 蜜 | 月 | 期 | 更 | 短 | 持 | 续 | 时 | 间 | 更 | 长 | 也 | 可 | 能 | 更 | 严 | 重 |',
  'num_samples': 143040,
  'gender': 'MALE'},
 {'id': 1888,
  'file_name': '6132308696345904995.wav',
  'raw_transcription': '重返家园的冲击比文化冲击来得更快(蜜月期更短),持续时间更长,也可能更严重。',
  'transcription': '重 返 家 园 的 冲 击 比 文 化 冲 击 来 得 更 快 蜜 月 期 更 短 持 续 时 间 更 长 也 可 能 更 严 重',
  '_': '重 | 返 | 家 | 园 | 的 | 冲 | 击 | 比 | 文 | 化 | 冲 | 击 | 来 | 得 | 更 | 快 | 蜜 | 月 | 期 | 更 | 短 | 持 | 续 | 时 | 间 | 更 | 长 | 也 | 可 | 能 | 更 | 严 | 重 |',
  'num_samples': 218880,
  'gender': 'MALE'},
 {'id': 1772,
  'file_name': '7110502387721136579.wav',
  'raw_transcription': '因此,很可能这个符号只是作为一个标签添加的。',
  'transcription': '因 此 很 可 能 这 个 符 号 只 是 作 为 一 个 标 签 添 加 的',
  '_': '因 | 此 | 很 | 可 | 能 | 这 | 个 | 符 | 号 | 只 | 是 | 作 | 为 | 一 | 个 | 标 | 签 | 添 | 加 | 的 |',
  'num_samples': 99840,
  'gender': 'MALE'},
 {'id': 1772,
  'file_name': '9867471378903953924.wav',
  'raw_transcription': '因此,很可能这个符号只是作为一个标签添加的。',
  'transcription': '因 此 很 可 能 这 个 符 号 只 是 作 为 一 个 标 签 添 加 的',
  '_': '因 | 此 | 很 | 可 | 能 | 这 | 个 | 符 | 号 | 只 | 是 | 作 | 为 | 一 | 个 | 标 | 签 | 添 | 加 | 的 |',
  'num_samples': 184000,
  'gender': 'MALE'},
 {'id': 1772,
  'file_name': '10325486695909573217.wav',
  'raw_transcription': '因此,很可能这个符号只是作为一个标签添加的。',
  'transcription': '因 此 很 可 能 这 个 符 号 只 是 作 为 一 个 标 签 添 加 的',
  '_': '因 | 此 | 很 | 可 | 能 | 这 | 个 | 符 | 号 | 只 | 是 | 作 | 为 | 一 | 个 | 标 | 签 | 添 | 加 | 的 |',
  'num_samples': 146880,
  'gender': 'MALE'},
 {'id': 1782,
  'file_name': '4934556178869851145.wav',
  'raw_transcription': '同样,历朝历代更迭期间都是一段小国分立的不稳定时代。其中最有名的便是长达 60 年的三国时期,该时期处于汉晋两代的更迭之间。',
  'transcription': '同 样 历 朝 历 代 更 迭 期 间 都 是 一 段 小 国 分 立 的 不 稳 定 时 代 其 中 最 有 名 的 便 是 长 达 60 年 的 三 国 时 期 该 时 期 处 于 汉 晋 两 代 的 更 迭 之 间',
  '_': '同 | 样 | 历 | 朝 | 历 | 代 | 更 | 迭 | 期 | 间 | 都 | 是 | 一 | 段 | 小 | 国 | 分 | 立 | 的 | 不 | 稳 | 定 | 时 | 代 | 其 | 中 | 最 | 有 | 名 | 的 | 便 | 是 | 长 | 达 | 6 0 | 年 | 的 | 三 | 国 | 时 | 期 | 该 | 时 | 期 | 处 | 于 | 汉 | 晋 | 两 | 代 | 的 | 更 | 迭 | 之 | 间 |',
  'num_samples': 214080,
  'gender': 'FEMALE'},
 {'id': 1782,
  'file_name': '7507638493814869010.wav',
  'raw_transcription': '同样,历朝历代更迭期间都是一段小国分立的不稳定时代。其中最有名的便是长达 60 年的三国时期,该时期处于汉晋两代的更迭之间。',
  'transcription': '同 样 历 朝 历 代 更 迭 期 间 都 是 一 段 小 国 分 立 的 不 稳 定 时 代 其 中 最 有 名 的 便 是 长 达 60 年 的 三 国 时 期 该 时 期 处 于 汉 晋 两 代 的 更 迭 之 间',
  '_': '同 | 样 | 历 | 朝 | 历 | 代 | 更 | 迭 | 期 | 间 | 都 | 是 | 一 | 段 | 小 | 国 | 分 | 立 | 的 | 不 | 稳 | 定 | 时 | 代 | 其 | 中 | 最 | 有 | 名 | 的 | 便 | 是 | 长 | 达 | 6 0 | 年 | 的 | 三 | 国 | 时 | 期 | 该 | 时 | 期 | 处 | 于 | 汉 | 晋 | 两 | 代 | 的 | 更 | 迭 | 之 | 间 |',
  'num_samples': 251520,
  'gender': 'MALE'},
 {'id': 1738,
  'file_name': '3171092229629378662.wav',
  'raw_transcription': '它会攻击任何进入水中的东西;即使像霸王龙之类的巨型恐龙也不是它的对手。',
  'transcription': '它 会 攻 击 任 何 进 入 水 中 的 东 西 即 使 像 霸 王 龙 之 类 的 巨 型 恐 龙 也 不 是 它 的 对 手',
  '_': '它 | 会 | 攻 | 击 | 任 | 何 | 进 | 入 | 水 | 中 | 的 | 东 | 西 | 即 | 使 | 像 | 霸 | 王 | 龙 | 之 | 类 | 的 | 巨 | 型 | 恐 | 龙 | 也 | 不 | 是 | 它 | 的 | 对 | 手 |',
  'num_samples': 138240,
  'gender': 'MALE'},
 {'id': 1738,
  'file_name': '2184108115593733480.wav',
  'raw_transcription': '它会攻击任何进入水中的东西;即使像霸王龙之类的巨型恐龙也不是它的对手。',
  'transcription': '它 会 攻 击 任 何 进 入 水 中 的 东 西 即 使 像 霸 王 龙 之 类 的 巨 型 恐 龙 也 不 是 它 的 对 手',
  '_': '它 | 会 | 攻 | 击 | 任 | 何 | 进 | 入 | 水 | 中 | 的 | 东 | 西 | 即 | 使 | 像 | 霸 | 王 | 龙 | 之 | 类 | 的 | 巨 | 型 | 恐 | 龙 | 也 | 不 | 是 | 它 | 的 | 对 | 手 |',
  'num_samples': 132480,
  'gender': 'MALE'},
 {'id': 1738,
  'file_name': '10540148133747674396.wav',
  'raw_transcription': '它会攻击任何进入水中的东西;即使像霸王龙之类的巨型恐龙也不是它的对手。',
  'transcription': '它 会 攻 击 任 何 进 入 水 中 的 东 西 即 使 像 霸 王 龙 之 类 的 巨 型 恐 龙 也 不 是 它 的 对 手',
  '_': '它 | 会 | 攻 | 击 | 任 | 何 | 进 | 入 | 水 | 中 | 的 | 东 | 西 | 即 | 使 | 像 | 霸 | 王 | 龙 | 之 | 类 | 的 | 巨 | 型 | 恐 | 龙 | 也 | 不 | 是 | 它 | 的 | 对 | 手 |',
  'num_samples': 243520,
  'gender': 'MALE'},
 {'id': 1995,
  'file_name': '5217965021762558271.wav',
  'raw_transcription': '虚拟支持内化在软件中,用来质疑、提示和解释那些可能对学生来说难以独自处理的程序。',
  'transcription': '虚 拟 支 持 内 化 在 软 件 中 用 来 质 疑 提 示 和 解 释 那 些 可 能 对 学 生 来 说 难 以 独 自 处 理 的 程 序',
  '_': '虚 | 拟 | 支 | 持 | 内 | 化 | 在 | 软 | 件 | 中 | 用 | 来 | 质 | 疑 | 提 | 示 | 和 | 解 | 释 | 那 | 些 | 可 | 能 | 对 | 学 | 生 | 来 | 说 | 难 | 以 | 独 | 自 | 处 | 理 | 的 | 程 | 序 |',
  'num_samples': 170880,
  'gender': 'MALE'},
 {'id': 1995,
  'file_name': '13737992583400421680.wav',
  'raw_transcription': '虚拟支持内化在软件中,用来质疑、提示和解释那些可能对学生来说难以独自处理的程序。',
  'transcription': '虚 拟 支 持 内 化 在 软 件 中 用 来 质 疑 提 示 和 解 释 那 些 可 能 对 学 生 来 说 难 以 独 自 处 理 的 程 序',
  '_': '虚 | 拟 | 支 | 持 | 内 | 化 | 在 | 软 | 件 | 中 | 用 | 来 | 质 | 疑 | 提 | 示 | 和 | 解 | 释 | 那 | 些 | 可 | 能 | 对 | 学 | 生 | 来 | 说 | 难 | 以 | 独 | 自 | 处 | 理 | 的 | 程 | 序 |',
  'num_samples': 163200,
  'gender': 'MALE'},
 {'id': 1714,
  'file_name': '4684120607228472865.wav',
  'raw_transcription': '卫星是由火箭发射到太空的。科学家在太空中使用望远镜是因为地球的大气层让某些光线和视野产生扭曲。',
  'transcription': '卫 星 是 由 火 箭 发 射 到 太 空 的 科 学 家 在 太 空 中 使 用 望 远 镜 是 因 为 地 球 的 大 气 层 让 某 些 光 线 和 视 野 产 生 扭 曲',
  '_': '卫 | 星 | 是 | 由 | 火 | 箭 | 发 | 射 | 到 | 太 | 空 | 的 | 科 | 学 | 家 | 在 | 太 | 空 | 中 | 使 | 用 | 望 | 远 | 镜 | 是 | 因 | 为 | 地 | 球 | 的 | 大 | 气 | 层 | 让 | 某 | 些 | 光 | 线 | 和 | 视 | 野 | 产 | 生 | 扭 | 曲 |',
  'num_samples': 217920,
  'gender': 'MALE'},
 {'id': 1714,
  'file_name': '9309812143649314173.wav',
  'raw_transcription': '卫星是由火箭发射到太空的。科学家在太空中使用望远镜是因为地球的大气层让某些光线和视野产生扭曲。',
  'transcription': '卫 星 是 由 火 箭 发 射 到 太 空 的 科 学 家 在 太 空 中 使 用 望 远 镜 是 因 为 地 球 的 大 气 层 让 某 些 光 线 和 视 野 产 生 扭 曲',
  '_': '卫 | 星 | 是 | 由 | 火 | 箭 | 发 | 射 | 到 | 太 | 空 | 的 | 科 | 学 | 家 | 在 | 太 | 空 | 中 | 使 | 用 | 望 | 远 | 镜 | 是 | 因 | 为 | 地 | 球 | 的 | 大 | 气 | 层 | 让 | 某 | 些 | 光 | 线 | 和 | 视 | 野 | 产 | 生 | 扭 | 曲 |',
  'num_samples': 174720,
  'gender': 'MALE'},
 {'id': 1714,
  'file_name': '12865044724041654126.wav',
  'raw_transcription': '卫星是由火箭发射到太空的。科学家在太空中使用望远镜是因为地球的大气层让某些光线和视野产生扭曲。',
  'transcription': '卫 星 是 由 火 箭 发 射 到 太 空 的 科 学 家 在 太 空 中 使 用 望 远 镜 是 因 为 地 球 的 大 气 层 让 某 些 光 线 和 视 野 产 生 扭 曲',
  '_': '卫 | 星 | 是 | 由 | 火 | 箭 | 发 | 射 | 到 | 太 | 空 | 的 | 科 | 学 | 家 | 在 | 太 | 空 | 中 | 使 | 用 | 望 | 远 | 镜 | 是 | 因 | 为 | 地 | 球 | 的 | 大 | 气 | 层 | 让 | 某 | 些 | 光 | 线 | 和 | 视 | 野 | 产 | 生 | 扭 | 曲 |',
  'num_samples': 170880,
  'gender': 'MALE'},
 {'id': 1947,
  'file_name': '16603961392996818946.wav',
  'raw_transcription': '在军队到来之前,海地自 19 世纪初以来从未遇到过与该疾病有关的问题。',
  'transcription': '在 军 队 到 来 之 前 海 地 自 19 世 纪 初 以 来 从 未 遇 到 过 与 该 疾 病 有 关 的 问 题',
  '_': '在 | 军 | 队 | 到 | 来 | 之 | 前 | 海 | 地 | 自 | 1 9 | 世 | 纪 | 初 | 以 | 来 | 从 | 未 | 遇 | 到 | 过 | 与 | 该 | 疾 | 病 | 有 | 关 | 的 | 问 | 题 |',
  'num_samples': 207040,
  'gender': 'MALE'},
 {'id': 1947,
  'file_name': '7469407384355477966.wav',
  'raw_transcription': '在军队到来之前,海地自 19 世纪初以来从未遇到过与该疾病有关的问题。',
  'transcription': '在 军 队 到 来 之 前 海 地 自 19 世 纪 初 以 来 从 未 遇 到 过 与 该 疾 病 有 关 的 问 题',
  '_': '在 | 军 | 队 | 到 | 来 | 之 | 前 | 海 | 地 | 自 | 1 9 | 世 | 纪 | 初 | 以 | 来 | 从 | 未 | 遇 | 到 | 过 | 与 | 该 | 疾 | 病 | 有 | 关 | 的 | 问 | 题 |',
  'num_samples': 129600,
  'gender': 'FEMALE'},
 {'id': 1947,
  'file_name': '12092955788306942672.wav',
  'raw_transcription': '在军队到来之前,海地自 19 世纪初以来从未遇到过与该疾病有关的问题。',
  'transcription': '在 军 队 到 来 之 前 海 地 自 19 世 纪 初 以 来 从 未 遇 到 过 与 该 疾 病 有 关 的 问 题',
  '_': '在 | 军 | 队 | 到 | 来 | 之 | 前 | 海 | 地 | 自 | 1 9 | 世 | 纪 | 初 | 以 | 来 | 从 | 未 | 遇 | 到 | 过 | 与 | 该 | 疾 | 病 | 有 | 关 | 的 | 问 | 题 |',
  'num_samples': 168000,
  'gender': 'MALE'},
 {'id': 1983,
  'file_name': '14058870824643679118.wav',
  'raw_transcription': '“文明”一词来自拉丁语“civilis”(意为“公民的”),与拉丁语"civis"(意为“公民”)及"civitas"(意为“城市”或“城邦”)都有关,这也以某种方式定义了社会的规模。',
  'transcription': ' 文明”一词来自拉丁语 civilis”意为 公民的”与拉丁语"civis"意为 公民”及"civitas"意为 城市”或 城邦”都有关这也以某种方式定义了社会的规模',
  '_': '文 明 ” 一 词 来 自 拉 丁 语 | c i v i l i s ” 意 为 | 公 民 的 ” 与 拉 丁 语 " c i v i s " 意 为 | 公 民 ” 及 " c i v i t a s " 意 为 | 城 市 ” 或 | 城 邦 ” 都 有 关 这 也 以 某 种 方 式 定 义 了 社 会 的 规 模 |',
  'num_samples': 234240,
  'gender': 'FEMALE'},
 {'id': 1983,
  'file_name': '6749596128638894093.wav',
  'raw_transcription': '“文明”一词来自拉丁语“civilis”(意为“公民的”),与拉丁语"civis"(意为“公民”)及"civitas"(意为“城市”或“城邦”)都有关,这也以某种方式定义了社会的规模。',
  'transcription': ' 文明”一词来自拉丁语 civilis”意为 公民的”与拉丁语"civis"意为 公民”及"civitas"意为 城市”或 城邦”都有关这也以某种方式定义了社会的规模',
  '_': '文 明 ” 一 词 来 自 拉 丁 语 | c i v i l i s ” 意 为 | 公 民 的 ” 与 拉 丁 语 " c i v i s " 意 为 | 公 民 ” 及 " c i v i t a s " 意 为 | 城 市 ” 或 | 城 邦 ” 都 有 关 这 也 以 某 种 方 式 定 义 了 社 会 的 规 模 |',
  'num_samples': 258240,
  'gender': 'MALE'},
 {'id': 1983,
  'file_name': '17863068715165422514.wav',
  'raw_transcription': '“文明”一词来自拉丁语“civilis”(意为“公民的”),与拉丁语"civis"(意为“公民”)及"civitas"(意为“城市”或“城邦”)都有关,这也以某种方式定义了社会的规模。',
  'transcription': ' 文明”一词来自拉丁语 civilis”意为 公民的”与拉丁语"civis"意为 公民”及"civitas"意为 城市”或 城邦”都有关这也以某种方式定义了社会的规模',
  '_': '文 明 ” 一 词 来 自 拉 丁 语 | c i v i l i s ” 意 为 | 公 民 的 ” 与 拉 丁 语 " c i v i s " 意 为 | 公 民 ” 及 " c i v i t a s " 意 为 | 城 市 ” 或 | 城 邦 ” 都 有 关 这 也 以 某 种 方 式 定 义 了 社 会 的 规 模 |',
  'num_samples': 300480,
  'gender': 'MALE'},
 {'id': 1879,
  'file_name': '5263446846737887867.wav',
  'raw_transcription': '人们只能猜测,当更新的产品出现时,键盘的结局会是怎样。',
  'transcription': '人 们 只 能 猜 测 当 更 新 的 产 品 出 现 时 键 盘 的 结 局 会 是 怎 样',
  '_': '人 | 们 | 只 | 能 | 猜 | 测 | 当 | 更 | 新 | 的 | 产 | 品 | 出 | 现 | 时 | 键 | 盘 | 的 | 结 | 局 | 会 | 是 | 怎 | 样 |',
  'num_samples': 190080,
  'gender': 'MALE'},
 {'id': 1879,
  'file_name': '16828055845902718528.wav',
  'raw_transcription': '人们只能猜测,当更新的产品出现时,键盘的结局会是怎样。',
  'transcription': '人 们 只 能 猜 测 当 更 新 的 产 品 出 现 时 键 盘 的 结 局 会 是 怎 样',
  '_': '人 | 们 | 只 | 能 | 猜 | 测 | 当 | 更 | 新 | 的 | 产 | 品 | 出 | 现 | 时 | 键 | 盘 | 的 | 结 | 局 | 会 | 是 | 怎 | 样 |',
  'num_samples': 188480,
  'gender': 'MALE'},
 {'id': 1879,
  'file_name': '9675468746706716686.wav',
  'raw_transcription': '人们只能猜测,当更新的产品出现时,键盘的结局会是怎样。',
  'transcription': '人 们 只 能 猜 测 当 更 新 的 产 品 出 现 时 键 盘 的 结 局 会 是 怎 样',
  '_': '人 | 们 | 只 | 能 | 猜 | 测 | 当 | 更 | 新 | 的 | 产 | 品 | 出 | 现 | 时 | 键 | 盘 | 的 | 结 | 局 | 会 | 是 | 怎 | 样 |',
  'num_samples': 122880,
  'gender': 'FEMALE'},
 {'id': 1962,
  'file_name': '8902383181429208245.wav',
  'raw_transcription': 'pH 值以被测化学品中的氢(pH 中的 H)离子数量表示。',
  'transcription': 'ph 值 以 被 测 化 学 品 中 的 氢 ph 中 的 h 离 子 数 量 表 示',
  '_': 'p h | 值 | 以 | 被 | 测 | 化 | 学 | 品 | 中 | 的 | 氢 | p h | 中 | 的 | h | 离 | 子 | 数 | 量 | 表 | 示 |',
  'num_samples': 117120,
  'gender': 'FEMALE'},
 {'id': 1962,
  'file_name': '10388181945260949729.wav',
  'raw_transcription': 'pH 值以被测化学品中的氢(pH 中的 H)离子数量表示。',
  'transcription': 'ph 值 以 被 测 化 学 品 中 的 氢 ph 中 的 h 离 子 数 量 表 示',
  '_': 'p h | 值 | 以 | 被 | 测 | 化 | 学 | 品 | 中 | 的 | 氢 | p h | 中 | 的 | h | 离 | 子 | 数 | 量 | 表 | 示 |',
  'num_samples': 135360,
  'gender': 'FEMALE'},
 {'id': 1962,
  'file_name': '14673610579908951121.wav',
  'raw_transcription': 'pH 值以被测化学品中的氢(pH 中的 H)离子数量表示。',
  'transcription': 'ph 值 以 被 测 化 学 品 中 的 氢 ph 中 的 h 离 子 数 量 表 示',
  '_': 'p h | 值 | 以 | 被 | 测 | 化 | 学 | 品 | 中 | 的 | 氢 | p h | 中 | 的 | h | 离 | 子 | 数 | 量 | 表 | 示 |',
  'num_samples': 155520,
  'gender': 'MALE'},
 {'id': 1807,
  'file_name': '14061651674962621054.wav',
  'raw_transcription': '意大利语也是大部分在该国工作的人日常使用的语言,拉丁语则常使用于宗教仪式。',
  'transcription': '意 大 利 语 也 是 大 部 分 在 该 国 工 作 的 人 日 常 使 用 的 语 言 拉 丁 语 则 常 使 用 于 宗 教 仪 式',
  '_': '意 | 大 | 利 | 语 | 也 | 是 | 大 | 部 | 分 | 在 | 该 | 国 | 工 | 作 | 的 | 人 | 日 | 常 | 使 | 用 | 的 | 语 | 言 | 拉 | 丁 | 语 | 则 | 常 | 使 | 用 | 于 | 宗 | 教 | 仪 | 式 |',
  'num_samples': 177600,
  'gender': 'MALE'},
 {'id': 1807,
  'file_name': '16789854686927936759.wav',
  'raw_transcription': '意大利语也是大部分在该国工作的人日常使用的语言,拉丁语则常使用于宗教仪式。',
  'transcription': '意 大 利 语 也 是 大 部 分 在 该 国 工 作 的 人 日 常 使 用 的 语 言 拉 丁 语 则 常 使 用 于 宗 教 仪 式',
  '_': '意 | 大 | 利 | 语 | 也 | 是 | 大 | 部 | 分 | 在 | 该 | 国 | 工 | 作 | 的 | 人 | 日 | 常 | 使 | 用 | 的 | 语 | 言 | 拉 | 丁 | 语 | 则 | 常 | 使 | 用 | 于 | 宗 | 教 | 仪 | 式 |',
  'num_samples': 182400,
  'gender': 'MALE'},
 {'id': 1807,
  'file_name': '12015707072919961829.wav',
  'raw_transcription': '意大利语也是大部分在该国工作的人日常使用的语言,拉丁语则常使用于宗教仪式。',
  'transcription': '意 大 利 语 也 是 大 部 分 在 该 国 工 作 的 人 日 常 使 用 的 语 言 拉 丁 语 则 常 使 用 于 宗 教 仪 式',
  '_': '意 | 大 | 利 | 语 | 也 | 是 | 大 | 部 | 分 | 在 | 该 | 国 | 工 | 作 | 的 | 人 | 日 | 常 | 使 | 用 | 的 | 语 | 言 | 拉 | 丁 | 语 | 则 | 常 | 使 | 用 | 于 | 宗 | 教 | 仪 | 式 |',
  'num_samples': 231040,
  'gender': 'MALE'},
 {'id': 1811,
  'file_name': '3533352580375308050.wav',
  'raw_transcription': '802.11n 标准在 2.4Ghz 和 5.0Ghz 频率上都可运行。',
  'transcription': '802.11n 标 准 在 2.4ghz 和 5.0ghz 频 率 上 都 可 运 行',
  '_': '8 0 2 . 1 1 n | 标 | 准 | 在 | 2 . 4 g h z | 和 | 5 . 0 g h z | 频 | 率 | 上 | 都 | 可 | 运 | 行 |',
  'num_samples': 230400,
  'gender': 'MALE'},
 {'id': 1811,
  'file_name': '1453904934495738372.wav',
  'raw_transcription': '802.11n 标准在 2.4Ghz 和 5.0Ghz 频率上都可运行。',
  'transcription': '802.11n 标 准 在 2.4ghz 和 5.0ghz 频 率 上 都 可 运 行',
  '_': '8 0 2 . 1 1 n | 标 | 准 | 在 | 2 . 4 g h z | 和 | 5 . 0 g h z | 频 | 率 | 上 | 都 | 可 | 运 | 行 |',
  'num_samples': 161280,
  'gender': 'MALE'},
 {'id': 1811,
  'file_name': '17196980000508284059.wav',
  'raw_transcription': '802.11n 标准在 2.4Ghz 和 5.0Ghz 频率上都可运行。',
  'transcription': '802.11n 标 准 在 2.4ghz 和 5.0ghz 频 率 上 都 可 运 行',
  '_': '8 0 2 . 1 1 n | 标 | 准 | 在 | 2 . 4 g h z | 和 | 5 . 0 g h z | 频 | 率 | 上 | 都 | 可 | 运 | 行 |',
  'num_samples': 166720,
  'gender': 'MALE'},
 {'id': 1960,
  'file_name': '16888312171483558824.wav',
  'raw_transcription': '报道称他年仅 20 多岁。比伯发表声明表示:“虽然我当时并不在场,也没有直接经历这起悲惨事故,但我仍为死者家属感到悲伤,为他们祈祷。”',
  'transcription': '报 道 称 他 年 仅 20 多 岁 比 伯 发 表 声 明 表 示 虽 然 我 当 时 并 不 在 场 也 没 有 直 接 经 历 这 起 悲 惨 事 故 但 我 仍 为 死 者 家 属 感 到 悲 伤 为 他 们 祈 祷',
  '_': '报 | 道 | 称 | 他 | 年 | 仅 | 2 0 | 多 | 岁 | 比 | 伯 | 发 | 表 | 声 | 明 | 表 | 示 | 虽 | 然 | 我 | 当 | 时 | 并 | 不 | 在 | 场 | 也 | 没 | 有 | 直 | 接 | 经 | 历 | 这 | 起 | 悲 | 惨 | 事 | 故 | 但 | 我 | 仍 | 为 | 死 | 者 | 家 | 属 | 感 | 到 | 悲 | 伤 | 为 | 他 | 们 | 祈 | 祷 |',
  'num_samples': 175680,
  'gender': 'FEMALE'},
 {'id': 1960,
  'file_name': '5822785433218729093.wav',
  'raw_transcription': '报道称他年仅 20 多岁。比伯发表声明表示:“虽然我当时并不在场,也没有直接经历这起悲惨事故,但我仍为死者家属感到悲伤,为他们祈祷。”',
  'transcription': '报 道 称 他 年 仅 20 多 岁 比 伯 发 表 声 明 表 示 虽 然 我 当 时 并 不 在 场 也 没 有 直 接 经 历 这 起 悲 惨 事 故 但 我 仍 为 死 者 家 属 感 到 悲 伤 为 他 们 祈 祷',
  '_': '报 | 道 | 称 | 他 | 年 | 仅 | 2 0 | 多 | 岁 | 比 | 伯 | 发 | 表 | 声 | 明 | 表 | 示 | 虽 | 然 | 我 | 当 | 时 | 并 | 不 | 在 | 场 | 也 | 没 | 有 | 直 | 接 | 经 | 历 | 这 | 起 | 悲 | 惨 | 事 | 故 | 但 | 我 | 仍 | 为 | 死 | 者 | 家 | 属 | 感 | 到 | 悲 | 伤 | 为 | 他 | 们 | 祈 | 祷 |',
  'num_samples': 323840,
  'gender': 'MALE'},
 {'id': 1960,
  'file_name': '6588643969081307790.wav',
  'raw_transcription': '报道称他年仅 20 多岁。比伯发表声明表示:“虽然我当时并不在场,也没有直接经历这起悲惨事故,但我仍为死者家属感到悲伤,为他们祈祷。”',
  'transcription': '报 道 称 他 年 仅 20 多 岁 比 伯 发 表 声 明 表 示 虽 然 我 当 时 并 不 在 场 也 没 有 直 接 经 历 这 起 悲 惨 事 故 但 我 仍 为 死 者 家 属 感 到 悲 伤 为 他 们 祈 祷',
  '_': '报 | 道 | 称 | 他 | 年 | 仅 | 2 0 | 多 | 岁 | 比 | 伯 | 发 | 表 | 声 | 明 | 表 | 示 | 虽 | 然 | 我 | 当 | 时 | 并 | 不 | 在 | 场 | 也 | 没 | 有 | 直 | 接 | 经 | 历 | 这 | 起 | 悲 | 惨 | 事 | 故 | 但 | 我 | 仍 | 为 | 死 | 者 | 家 | 属 | 感 | 到 | 悲 | 伤 | 为 | 他 | 们 | 祈 | 祷 |',
  'num_samples': 245760,
  'gender': 'MALE'},
 {'id': 1974,
  'file_name': '14125944580545897739.wav',
  'raw_transcription': '同理,男士也必须穿着长裤,遮住膝盖。',
  'transcription': '同 理 男 士 也 必 须 穿 着 长 裤 遮 住 膝 盖',
  '_': '同 | 理 | 男 | 士 | 也 | 必 | 须 | 穿 | 着 | 长 | 裤 | 遮 | 住 | 膝 | 盖 |',
  'num_samples': 133760,
  'gender': 'MALE'},
 {'id': 1974,
  'file_name': '8107720956886769719.wav',
  'raw_transcription': '同理,男士也必须穿着长裤,遮住膝盖。',
  'transcription': '同 理 男 士 也 必 须 穿 着 长 裤 遮 住 膝 盖',
  '_': '同 | 理 | 男 | 士 | 也 | 必 | 须 | 穿 | 着 | 长 | 裤 | 遮 | 住 | 膝 | 盖 |',
  'num_samples': 81600,
  'gender': 'FEMALE'},
 {'id': 1974,
  'file_name': '14723629664373039045.wav',
  'raw_transcription': '同理,男士也必须穿着长裤,遮住膝盖。',
  'transcription': '同 理 男 士 也 必 须 穿 着 长 裤 遮 住 膝 盖',
  '_': '同 | 理 | 男 | 士 | 也 | 必 | 须 | 穿 | 着 | 长 | 裤 | 遮 | 住 | 膝 | 盖 |',
  'num_samples': 159360,
  'gender': 'MALE'},
 {'id': 2003,
  'file_name': '2281395039953267780.wav',
  'raw_transcription': '若想从最佳角度欣赏香港的美景,可以离开该岛,前往对面的九龙海滨。',
  'transcription': '若 想 从 最 佳 角 度 欣 赏 香 港 的 美 景 可 以 离 开 该 岛 前 往 对 面 的 九 龙 海 滨',
  '_': '若 | 想 | 从 | 最 | 佳 | 角 | 度 | 欣 | 赏 | 香 | 港 | 的 | 美 | 景 | 可 | 以 | 离 | 开 | 该 | 岛 | 前 | 往 | 对 | 面 | 的 | 九 | 龙 | 海 | 滨 |',
  'num_samples': 117120,
  'gender': 'FEMALE'},
 {'id': 2003,
  'file_name': '168226934337377373.wav',
  'raw_transcription': '若想从最佳角度欣赏香港的美景,可以离开该岛,前往对面的九龙海滨。',
  'transcription': '若 想 从 最 佳 角 度 欣 赏 香 港 的 美 景 可 以 离 开 该 岛 前 往 对 面 的 九 龙 海 滨',
  '_': '若 | 想 | 从 | 最 | 佳 | 角 | 度 | 欣 | 赏 | 香 | 港 | 的 | 美 | 景 | 可 | 以 | 离 | 开 | 该 | 岛 | 前 | 往 | 对 | 面 | 的 | 九 | 龙 | 海 | 滨 |',
  'num_samples': 197120,
  'gender': 'MALE'},
 {'id': 2003,
  'file_name': '10836453965609915738.wav',
  'raw_transcription': '若想从最佳角度欣赏香港的美景,可以离开该岛,前往对面的九龙海滨。',
  'transcription': '若 想 从 最 佳 角 度 欣 赏 香 港 的 美 景 可 以 离 开 该 岛 前 往 对 面 的 九 龙 海 滨',
  '_': '若 | 想 | 从 | 最 | 佳 | 角 | 度 | 欣 | 赏 | 香 | 港 | 的 | 美 | 景 | 可 | 以 | 离 | 开 | 该 | 岛 | 前 | 往 | 对 | 面 | 的 | 九 | 龙 | 海 | 滨 |',
  'num_samples': 158400,
  'gender': 'MALE'},
 {'id': 1948,
  'file_name': '238433062376943035.wav',
  'raw_transcription': '三国是中国古代历史上最血腥的时代之一。成千上万的人为了争夺西安豪华宫殿最高的权力而死去。',
  'transcription': '三 国 是 中 国 古 代 历 史 上 最 血 腥 的 时 代 之 一 成 千 上 万 的 人 为 了 争 夺 西 安 豪 华 宫 殿 最 高 的 权 力 而 死 去',
  '_': '三 | 国 | 是 | 中 | 国 | 古 | 代 | 历 | 史 | 上 | 最 | 血 | 腥 | 的 | 时 | 代 | 之 | 一 | 成 | 千 | 上 | 万 | 的 | 人 | 为 | 了 | 争 | 夺 | 西 | 安 | 豪 | 华 | 宫 | 殿 | 最 | 高 | 的 | 权 | 力 | 而 | 死 | 去 |',
  'num_samples': 135360,
  'gender': 'FEMALE'},
 {'id': 1948,
  'file_name': '5500508974430912773.wav',
  'raw_transcription': '三国是中国古代历史上最血腥的时代之一。成千上万的人为了争夺西安豪华宫殿最高的权力而死去。',
  'transcription': '三 国 是 中 国 古 代 历 史 上 最 血 腥 的 时 代 之 一 成 千 上 万 的 人 为 了 争 夺 西 安 豪 华 宫 殿 最 高 的 权 力 而 死 去',
  '_': '三 | 国 | 是 | 中 | 国 | 古 | 代 | 历 | 史 | 上 | 最 | 血 | 腥 | 的 | 时 | 代 | 之 | 一 | 成 | 千 | 上 | 万 | 的 | 人 | 为 | 了 | 争 | 夺 | 西 | 安 | 豪 | 华 | 宫 | 殿 | 最 | 高 | 的 | 权 | 力 | 而 | 死 | 去 |',
  'num_samples': 200640,
  'gender': 'MALE'},
 {'id': 1948,
  'file_name': '18141634762377399210.wav',
  'raw_transcription': '三国是中国古代历史上最血腥的时代之一。成千上万的人为了争夺西安豪华宫殿最高的权力而死去。',
  'transcription': '三 国 是 中 国 古 代 历 史 上 最 血 腥 的 时 代 之 一 成 千 上 万 的 人 为 了 争 夺 西 安 豪 华 宫 殿 最 高 的 权 力 而 死 去',
  '_': '三 | 国 | 是 | 中 | 国 | 古 | 代 | 历 | 史 | 上 | 最 | 血 | 腥 | 的 | 时 | 代 | 之 | 一 | 成 | 千 | 上 | 万 | 的 | 人 | 为 | 了 | 争 | 夺 | 西 | 安 | 豪 | 华 | 宫 | 殿 | 最 | 高 | 的 | 权 | 力 | 而 | 死 | 去 |',
  'num_samples': 173760,
  'gender': 'MALE'},
 {'id': 1791,
  'file_name': '14910853651320017401.wav',
  'raw_transcription': '切勿在建筑物上做标记或涂鸦,以免破坏遗址。',
  'transcription': '切 勿 在 建 筑 物 上 做 标 记 或 涂 鸦 以 免 破 坏 遗 址',
  '_': '切 | 勿 | 在 | 建 | 筑 | 物 | 上 | 做 | 标 | 记 | 或 | 涂 | 鸦 | 以 | 免 | 破 | 坏 | 遗 | 址 |',
  'num_samples': 115200,
  'gender': 'MALE'},
 {'id': 1791,
  'file_name': '9659301068108588246.wav',
  'raw_transcription': '切勿在建筑物上做标记或涂鸦,以免破坏遗址。',
  'transcription': '切 勿 在 建 筑 物 上 做 标 记 或 涂 鸦 以 免 破 坏 遗 址',
  '_': '切 | 勿 | 在 | 建 | 筑 | 物 | 上 | 做 | 标 | 记 | 或 | 涂 | 鸦 | 以 | 免 | 破 | 坏 | 遗 | 址 |',
  'num_samples': 107520,
  'gender': 'MALE'},
 {'id': 1791,
  'file_name': '3338374366145231782.wav',
  'raw_transcription': '切勿在建筑物上做标记或涂鸦,以免破坏遗址。',
  'transcription': '切 勿 在 建 筑 物 上 做 标 记 或 涂 鸦 以 免 破 坏 遗 址',
  '_': '切 | 勿 | 在 | 建 | 筑 | 物 | 上 | 做 | 标 | 记 | 或 | 涂 | 鸦 | 以 | 免 | 破 | 坏 | 遗 | 址 |',
  'num_samples': 75840,
  'gender': 'FEMALE'},
 {'id': 1943,
  'file_name': '1651820524132841258.wav',
  'raw_transcription': '压力越小,生命力就表现得越积极。每个人都有可能找到绝对的平静和满足。',
  'transcription': '压 力 越 小 生 命 力 就 表 现 得 越 积 极 每 个 人 都 有 可 能 找 到 绝 对 的 平 静 和 满 足',
  '_': '压 | 力 | 越 | 小 | 生 | 命 | 力 | 就 | 表 | 现 | 得 | 越 | 积 | 极 | 每 | 个 | 人 | 都 | 有 | 可 | 能 | 找 | 到 | 绝 | 对 | 的 | 平 | 静 | 和 | 满 | 足 |',
  'num_samples': 109440,
  'gender': 'FEMALE'},
 {'id': 1943,
  'file_name': '7305205291638652040.wav',
  'raw_transcription': '压力越小,生命力就表现得越积极。每个人都有可能找到绝对的平静和满足。',
  'transcription': '压 力 越 小 生 命 力 就 表 现 得 越 积 极 每 个 人 都 有 可 能 找 到 绝 对 的 平 静 和 满 足',
  '_': '压 | 力 | 越 | 小 | 生 | 命 | 力 | 就 | 表 | 现 | 得 | 越 | 积 | 极 | 每 | 个 | 人 | 都 | 有 | 可 | 能 | 找 | 到 | 绝 | 对 | 的 | 平 | 静 | 和 | 满 | 足 |',
  'num_samples': 118080,
  'gender': 'FEMALE'},
 {'id': 1752,
  'file_name': '3655038511340325298.wav',
  'raw_transcription': '结果,两种鱼类灭绝,另外两种鱼类濒临灭绝,其中包括弓背鲑。',
  'transcription': '结 果 两 种 鱼 类 灭 绝 另 外 两 种 鱼 类 濒 临 灭 绝 其 中 包 括 弓 背 鲑',
  '_': '结 | 果 | 两 | 种 | 鱼 | 类 | 灭 | 绝 | 另 | 外 | 两 | 种 | 鱼 | 类 | 濒 | 临 | 灭 | 绝 | 其 | 中 | 包 | 括 | 弓 | 背 | 鲑 |',
  'num_samples': 136320,
  'gender': 'MALE'},
 {'id': 1752,
  'file_name': '17392666514929246193.wav',
  'raw_transcription': '结果,两种鱼类灭绝,另外两种鱼类濒临灭绝,其中包括弓背鲑。',
  'transcription': '结 果 两 种 鱼 类 灭 绝 另 外 两 种 鱼 类 濒 临 灭 绝 其 中 包 括 弓 背 鲑',
  '_': '结 | 果 | 两 | 种 | 鱼 | 类 | 灭 | 绝 | 另 | 外 | 两 | 种 | 鱼 | 类 | 濒 | 临 | 灭 | 绝 | 其 | 中 | 包 | 括 | 弓 | 背 | 鲑 |',
  'num_samples': 107520,
  'gender': 'FEMALE'},
 {'id': 1890,
  'file_name': '10073099671796350432.wav',
  'raw_transcription': '大多数现代科研望远镜都是巨型设施,位于大气条件优良的偏远地区。',
  'transcription': '大 多 数 现 代 科 研 望 远 镜 都 是 巨 型 设 施 位 于 大 气 条 件 优 良 的 偏 远 地 区',
  '_': '大 | 多 | 数 | 现 | 代 | 科 | 研 | 望 | 远 | 镜 | 都 | 是 | 巨 | 型 | 设 | 施 | 位 | 于 | 大 | 气 | 条 | 件 | 优 | 良 | 的 | 偏 | 远 | 地 | 区 |',
  'num_samples': 219840,
  'gender': 'MALE'},
 {'id': 1890,
  'file_name': '8844279899288508677.wav',
  'raw_transcription': '大多数现代科研望远镜都是巨型设施,位于大气条件优良的偏远地区。',
  'transcription': '大 多 数 现 代 科 研 望 远 镜 都 是 巨 型 设 施 位 于 大 气 条 件 优 良 的 偏 远 地 区',
  '_': '大 | 多 | 数 | 现 | 代 | 科 | 研 | 望 | 远 | 镜 | 都 | 是 | 巨 | 型 | 设 | 施 | 位 | 于 | 大 | 气 | 条 | 件 | 优 | 良 | 的 | 偏 | 远 | 地 | 区 |',
  'num_samples': 155520,
  'gender': 'MALE'},
 {'id': 1868,
  'file_name': '8117946781875833008.wav',
  'raw_transcription': '在另一种极端情况下,这个人会变成一个与之前迥然不同的个体,觉得他/她必须改变团队所做的一切,并把成果据为己有。',
  'transcription': '在 另 一 种 极 端 情 况 下 这 个 人 会 变 成 一 个 与 之 前 迥 然 不 同 的 个 体 觉 得 他 她 必 须 改 变 团 队 所 做 的 一 切 并 把 成 果 据 为 己 有',
  '_': '在 | 另 | 一 | 种 | 极 | 端 | 情 | 况 | 下 | 这 | 个 | 人 | 会 | 变 | 成 | 一 | 个 | 与 | 之 | 前 | 迥 | 然 | 不 | 同 | 的 | 个 | 体 | 觉 | 得 | 他 | 她 | 必 | 须 | 改 | 变 | 团 | 队 | 所 | 做 | 的 | 一 | 切 | 并 | 把 | 成 | 果 | 据 | 为 | 己 | 有 |',
  'num_samples': 274880,
  'gender': 'MALE'},
 {'id': 1868,
  'file_name': '10730178299232374639.wav',
  'raw_transcription': '在另一种极端情况下,这个人会变成一个与之前迥然不同的个体,觉得他/她必须改变团队所做的一切,并把成果据为己有。',
  'transcription': '在 另 一 种 极 端 情 况 下 这 个 人 会 变 成 一 个 与 之 前 迥 然 不 同 的 个 体 觉 得 他 她 必 须 改 变 团 队 所 做 的 一 切 并 把 成 果 据 为 己 有',
  '_': '在 | 另 | 一 | 种 | 极 | 端 | 情 | 况 | 下 | 这 | 个 | 人 | 会 | 变 | 成 | 一 | 个 | 与 | 之 | 前 | 迥 | 然 | 不 | 同 | 的 | 个 | 体 | 觉 | 得 | 他 | 她 | 必 | 须 | 改 | 变 | 团 | 队 | 所 | 做 | 的 | 一 | 切 | 并 | 把 | 成 | 果 | 据 | 为 | 己 | 有 |',
  'num_samples': 302080,
  'gender': 'MALE'},
 {'id': 1868,
  'file_name': '9069385194138280326.wav',
  'raw_transcription': '在另一种极端情况下,这个人会变成一个与之前迥然不同的个体,觉得他/她必须改变团队所做的一切,并把成果据为己有。',
  'transcription': '在 另 一 种 极 端 情 况 下 这 个 人 会 变 成 一 个 与 之 前 迥 然 不 同 的 个 体 觉 得 他 她 必 须 改 变 团 队 所 做 的 一 切 并 把 成 果 据 为 己 有',
  '_': '在 | 另 | 一 | 种 | 极 | 端 | 情 | 况 | 下 | 这 | 个 | 人 | 会 | 变 | 成 | 一 | 个 | 与 | 之 | 前 | 迥 | 然 | 不 | 同 | 的 | 个 | 体 | 觉 | 得 | 他 | 她 | 必 | 须 | 改 | 变 | 团 | 队 | 所 | 做 | 的 | 一 | 切 | 并 | 把 | 成 | 果 | 据 | 为 | 己 | 有 |',
  'num_samples': 295360,
  'gender': 'MALE'},
 {'id': 1827,
  'file_name': '474628238482097702.wav',
  'raw_transcription': '地壳近侧厚约 70 公里,远侧厚约 100 公里。',
  'transcription': '地 壳 近 侧 厚 约 70 公 里 远 侧 厚 约 100 公 里',
  '_': '地 | 壳 | 近 | 侧 | 厚 | 约 | 7 0 | 公 | 里 | 远 | 侧 | 厚 | 约 | 1 0 0 | 公 | 里 |',
  'num_samples': 122880,
  'gender': 'MALE'},
 {'id': 1827,
  'file_name': '4910819615532149691.wav',
  'raw_transcription': '地壳近侧厚约 70 公里,远侧厚约 100 公里。',
  'transcription': '地 壳 近 侧 厚 约 70 公 里 远 侧 厚 约 100 公 里',
  '_': '地 | 壳 | 近 | 侧 | 厚 | 约 | 7 0 | 公 | 里 | 远 | 侧 | 厚 | 约 | 1 0 0 | 公 | 里 |',
  'num_samples': 79680,
  'gender': 'FEMALE'},
 {'id': 1833,
  'file_name': '7474371219310370017.wav',
  'raw_transcription': '哲学家亚里士多德提出一种理论,即任何事物都是由土、水、空气和火四种元素中的一种或多种组成的。',
  'transcription': '哲 学 家 亚 里 士 多 德 提 出 一 种 理 论 即 任 何 事 物 都 是 由 土 水 空 气 和 火 四 种 元 素 中 的 一 种 或 多 种 组 成 的',
  '_': '哲 | 学 | 家 | 亚 | 里 | 士 | 多 | 德 | 提 | 出 | 一 | 种 | 理 | 论 | 即 | 任 | 何 | 事 | 物 | 都 | 是 | 由 | 土 | 水 | 空 | 气 | 和 | 火 | 四 | 种 | 元 | 素 | 中 | 的 | 一 | 种 | 或 | 多 | 种 | 组 | 成 | 的 |',
  'num_samples': 279360,
  'gender': 'MALE'},
 {'id': 1833,
  'file_name': '13319165352419507810.wav',
  'raw_transcription': '哲学家亚里士多德提出一种理论,即任何事物都是由土、水、空气和火四种元素中的一种或多种组成的。',
  'transcription': '哲 学 家 亚 里 士 多 德 提 出 一 种 理 论 即 任 何 事 物 都 是 由 土 水 空 气 和 火 四 种 元 素 中 的 一 种 或 多 种 组 成 的',
  '_': '哲 | 学 | 家 | 亚 | 里 | 士 | 多 | 德 | 提 | 出 | 一 | 种 | 理 | 论 | 即 | 任 | 何 | 事 | 物 | 都 | 是 | 由 | 土 | 水 | 空 | 气 | 和 | 火 | 四 | 种 | 元 | 素 | 中 | 的 | 一 | 种 | 或 | 多 | 种 | 组 | 成 | 的 |',
  'num_samples': 254720,
  'gender': 'MALE'},
 {'id': 1832,
  'file_name': '2789418301084839014.wav',
  'raw_transcription': '流行的运动项目包括足球、篮球、排球、水球、击剑、橄榄球、自行车、冰球、轮滑曲棍球和一级方程式赛车。',
  'transcription': '流 行 的 运 动 项 目 包 括 足 球 篮 球 排 球 水 球 击 剑 橄 榄 球 自 行 车 冰 球 轮 滑 曲 棍 球 和 一 级 方 程 式 赛 车',
  '_': '流 | 行 | 的 | 运 | 动 | 项 | 目 | 包 | 括 | 足 | 球 | 篮 | 球 | 排 | 球 | 水 | 球 | 击 | 剑 | 橄 | 榄 | 球 | 自 | 行 | 车 | 冰 | 球 | 轮 | 滑 | 曲 | 棍 | 球 | 和 | 一 | 级 | 方 | 程 | 式 | 赛 | 车 |',
  'num_samples': 159360,
  'gender': 'FEMALE'},
 {'id': 1832,
  'file_name': '14135852628365137377.wav',
  'raw_transcription': '流行的运动项目包括足球、篮球、排球、水球、击剑、橄榄球、自行车、冰球、轮滑曲棍球和一级方程式赛车。',
  'transcription': '流 行 的 运 动 项 目 包 括 足 球 篮 球 排 球 水 球 击 剑 橄 榄 球 自 行 车 冰 球 轮 滑 曲 棍 球 和 一 级 方 程 式 赛 车',
  '_': '流 | 行 | 的 | 运 | 动 | 项 | 目 | 包 | 括 | 足 | 球 | 篮 | 球 | 排 | 球 | 水 | 球 | 击 | 剑 | 橄 | 榄 | 球 | 自 | 行 | 车 | 冰 | 球 | 轮 | 滑 | 曲 | 棍 | 球 | 和 | 一 | 级 | 方 | 程 | 式 | 赛 | 车 |',
  'num_samples': 140160,
  'gender': 'FEMALE'},
 {'id': 1832,
  'file_name': '12970434464236239404.wav',
  'raw_transcription': '流行的运动项目包括足球、篮球、排球、水球、击剑、橄榄球、自行车、冰球、轮滑曲棍球和一级方程式赛车。',
  'transcription': '流 行 的 运 动 项 目 包 括 足 球 篮 球 排 球 水 球 击 剑 橄 榄 球 自 行 车 冰 球 轮 滑 曲 棍 球 和 一 级 方 程 式 赛 车',
  '_': '流 | 行 | 的 | 运 | 动 | 项 | 目 | 包 | 括 | 足 | 球 | 篮 | 球 | 排 | 球 | 水 | 球 | 击 | 剑 | 橄 | 榄 | 球 | 自 | 行 | 车 | 冰 | 球 | 轮 | 滑 | 曲 | 棍 | 球 | 和 | 一 | 级 | 方 | 程 | 式 | 赛 | 车 |',
  'num_samples': 295680,
  'gender': 'MALE'},
 {'id': 1754,
  'file_name': '15368993488130174566.wav',
  'raw_transcription': '因为地壳更薄,所以近的一面可能会有更多的阴暗部,熔岩更容易上升到地表。',
  'transcription': '因 为 地 壳 更 薄 所 以 近 的 一 面 可 能 会 有 更 多 的 阴 暗 部 熔 岩 更 容 易 上 升 到 地 表',
  '_': '因 | 为 | 地 | 壳 | 更 | 薄 | 所 | 以 | 近 | 的 | 一 | 面 | 可 | 能 | 会 | 有 | 更 | 多 | 的 | 阴 | 暗 | 部 | 熔 | 岩 | 更 | 容 | 易 | 上 | 升 | 到 | 地 | 表 |',
  'num_samples': 217280,
  'gender': 'MALE'},
 {'id': 1754,
  'file_name': '16306893138105542585.wav',
  'raw_transcription': '因为地壳更薄,所以近的一面可能会有更多的阴暗部,熔岩更容易上升到地表。',
  'transcription': '因 为 地 壳 更 薄 所 以 近 的 一 面 可 能 会 有 更 多 的 阴 暗 部 熔 岩 更 容 易 上 升 到 地 表',
  '_': '因 | 为 | 地 | 壳 | 更 | 薄 | 所 | 以 | 近 | 的 | 一 | 面 | 可 | 能 | 会 | 有 | 更 | 多 | 的 | 阴 | 暗 | 部 | 熔 | 岩 | 更 | 容 | 易 | 上 | 升 | 到 | 地 | 表 |',
  'num_samples': 272960,
  'gender': 'MALE'},
 {'id': 1829,
  'file_name': '6391769708811013093.wav',
  'raw_transcription': '前往课征重税的国家/地区的旅客有时可以省下一大笔钱,在这些地方购买酒水和烟草等产品特别划算。',
  'transcription': '前 往 课 征 重 税 的 国 家 地 区 的 旅 客 有 时 可 以 省 下 一 大 笔 钱 在 这 些 地 方 购 买 酒 水 和 烟 草 等 产 品 特 别 划 算',
  '_': '前 | 往 | 课 | 征 | 重 | 税 | 的 | 国 | 家 | 地 | 区 | 的 | 旅 | 客 | 有 | 时 | 可 | 以 | 省 | 下 | 一 | 大 | 笔 | 钱 | 在 | 这 | 些 | 地 | 方 | 购 | 买 | 酒 | 水 | 和 | 烟 | 草 | 等 | 产 | 品 | 特 | 别 | 划 | 算 |',
  'num_samples': 169920,
  'gender': 'FEMALE'},
 {'id': 1829,
  'file_name': '4826929088238693494.wav',
  'raw_transcription': '前往课征重税的国家/地区的旅客有时可以省下一大笔钱,在这些地方购买酒水和烟草等产品特别划算。',
  'transcription': '前 往 课 征 重 税 的 国 家 地 区 的 旅 客 有 时 可 以 省 下 一 大 笔 钱 在 这 些 地 方 购 买 酒 水 和 烟 草 等 产 品 特 别 划 算',
  '_': '前 | 往 | 课 | 征 | 重 | 税 | 的 | 国 | 家 | 地 | 区 | 的 | 旅 | 客 | 有 | 时 | 可 | 以 | 省 | 下 | 一 | 大 | 笔 | 钱 | 在 | 这 | 些 | 地 | 方 | 购 | 买 | 酒 | 水 | 和 | 烟 | 草 | 等 | 产 | 品 | 特 | 别 | 划 | 算 |',
  'num_samples': 140160,
  'gender': 'FEMALE'},
 {'id': 1829,
  'file_name': '6847838456051779812.wav',
  'raw_transcription': '前往课征重税的国家/地区的旅客有时可以省下一大笔钱,在这些地方购买酒水和烟草等产品特别划算。',
  'transcription': '前 往 课 征 重 税 的 国 家 地 区 的 旅 客 有 时 可 以 省 下 一 大 笔 钱 在 这 些 地 方 购 买 酒 水 和 烟 草 等 产 品 特 别 划 算',
  '_': '前 | 往 | 课 | 征 | 重 | 税 | 的 | 国 | 家 | 地 | 区 | 的 | 旅 | 客 | 有 | 时 | 可 | 以 | 省 | 下 | 一 | 大 | 笔 | 钱 | 在 | 这 | 些 | 地 | 方 | 购 | 买 | 酒 | 水 | 和 | 烟 | 草 | 等 | 产 | 品 | 特 | 别 | 划 | 算 |',
  'num_samples': 164160,
  'gender': 'FEMALE'},
 {'id': 2006,
  'file_name': '10040380210557600780.wav',
  'raw_transcription': '钙、钾等元素属于金属,银和金等元素当然也是金属。',
  'transcription': '钙 钾 等 元 素 属 于 金 属 银 和 金 等 元 素 当 然 也 是 金 属',
  '_': '钙 | 钾 | 等 | 元 | 素 | 属 | 于 | 金 | 属 | 银 | 和 | 金 | 等 | 元 | 素 | 当 | 然 | 也 | 是 | 金 | 属 |',
  'num_samples': 132480,
  'gender': 'MALE'},
 {'id': 2006,
  'file_name': '4046694729792919859.wav',
  'raw_transcription': '钙、钾等元素属于金属,银和金等元素当然也是金属。',
  'transcription': '钙 钾 等 元 素 属 于 金 属 银 和 金 等 元 素 当 然 也 是 金 属',
  '_': '钙 | 钾 | 等 | 元 | 素 | 属 | 于 | 金 | 属 | 银 | 和 | 金 | 等 | 元 | 素 | 当 | 然 | 也 | 是 | 金 | 属 |',
  'num_samples': 210560,
  'gender': 'MALE'},
 {'id': 1957,
  'file_name': '680780473159647483.wav',
  'raw_transcription': '他把谣言称为“政治碎碎念和愚蠢行为”。',
  'transcription': '他 把 谣 言 称 为 政 治 碎 碎 念 和 愚 蠢 行 为',
  '_': '他 | 把 | 谣 | 言 | 称 | 为 | 政 | 治 | 碎 | 碎 | 念 | 和 | 愚 | 蠢 | 行 | 为 |',
  'num_samples': 121920,
  'gender': 'MALE'},
 {'id': 1957,
  'file_name': '454772499289221744.wav',
  'raw_transcription': '他把谣言称为“政治碎碎念和愚蠢行为”。',
  'transcription': '他 把 谣 言 称 为 政 治 碎 碎 念 和 愚 蠢 行 为',
  '_': '他 | 把 | 谣 | 言 | 称 | 为 | 政 | 治 | 碎 | 碎 | 念 | 和 | 愚 | 蠢 | 行 | 为 |',
  'num_samples': 72000,
  'gender': 'FEMALE'},
 {'id': 1957,
  'file_name': '15059499206385059537.wav',
  'raw_transcription': '他把谣言称为“政治碎碎念和愚蠢行为”。',
  'transcription': '他 把 谣 言 称 为 政 治 碎 碎 念 和 愚 蠢 行 为',
  '_': '他 | 把 | 谣 | 言 | 称 | 为 | 政 | 治 | 碎 | 碎 | 念 | 和 | 愚 | 蠢 | 行 | 为 |',
  'num_samples': 168000,
  'gender': 'MALE'},
 {'id': 1907,
  'file_name': '1883252333513931071.wav',
  'raw_transcription': '敌对行动爆发后不久,英国开始对德国实施海上封锁。',
  'transcription': '敌 对 行 动 爆 发 后 不 久 英 国 开 始 对 德 国 实 施 海 上 封 锁',
  '_': '敌 | 对 | 行 | 动 | 爆 | 发 | 后 | 不 | 久 | 英 | 国 | 开 | 始 | 对 | 德 | 国 | 实 | 施 | 海 | 上 | 封 | 锁 |',
  'num_samples': 183680,
  'gender': 'MALE'},
 {'id': 1907,
  'file_name': '2085951887838771948.wav',
  'raw_transcription': '敌对行动爆发后不久,英国开始对德国实施海上封锁。',
  'transcription': '敌 对 行 动 爆 发 后 不 久 英 国 开 始 对 德 国 实 施 海 上 封 锁',
  '_': '敌 | 对 | 行 | 动 | 爆 | 发 | 后 | 不 | 久 | 英 | 国 | 开 | 始 | 对 | 德 | 国 | 实 | 施 | 海 | 上 | 封 | 锁 |',
  'num_samples': 184640,
  'gender': 'MALE'},
 {'id': 1907,
  'file_name': '14612379116640321265.wav',
  'raw_transcription': '敌对行动爆发后不久,英国开始对德国实施海上封锁。',
  'transcription': '敌 对 行 动 爆 发 后 不 久 英 国 开 始 对 德 国 实 施 海 上 封 锁',
  '_': '敌 | 对 | 行 | 动 | 爆 | 发 | 后 | 不 | 久 | 英 | 国 | 开 | 始 | 对 | 德 | 国 | 实 | 施 | 海 | 上 | 封 | 锁 |',
  'num_samples': 173760,
  'gender': 'MALE'},
 {'id': 1861,
  'file_name': '9133386560591043569.wav',
  'raw_transcription': '结果,演员在舞台上吸食大麻,剧院本身也鼓励观众一起加入。',
  'transcription': '结 果 演 员 在 舞 台 上 吸 食 大 麻 剧 院 本 身 也 鼓 励 观 众 一 起 加 入',
  '_': '结 | 果 | 演 | 员 | 在 | 舞 | 台 | 上 | 吸 | 食 | 大 | 麻 | 剧 | 院 | 本 | 身 | 也 | 鼓 | 励 | 观 | 众 | 一 | 起 | 加 | 入 |',
  'num_samples': 118080,
  'gender': 'MALE'},
 {'id': 1861,
  'file_name': '5043418108389623238.wav',
  'raw_transcription': '结果,演员在舞台上吸食大麻,剧院本身也鼓励观众一起加入。',
  'transcription': '结 果 演 员 在 舞 台 上 吸 食 大 麻 剧 院 本 身 也 鼓 励 观 众 一 起 加 入',
  '_': '结 | 果 | 演 | 员 | 在 | 舞 | 台 | 上 | 吸 | 食 | 大 | 麻 | 剧 | 院 | 本 | 身 | 也 | 鼓 | 励 | 观 | 众 | 一 | 起 | 加 | 入 |',
  'num_samples': 104640,
  'gender': 'FEMALE'},
 {'id': 1861,
  'file_name': '13126348209565754873.wav',
  'raw_transcription': '结果,演员在舞台上吸食大麻,剧院本身也鼓励观众一起加入。',
  'transcription': '结 果 演 员 在 舞 台 上 吸 食 大 麻 剧 院 本 身 也 鼓 励 观 众 一 起 加 入',
  '_': '结 | 果 | 演 | 员 | 在 | 舞 | 台 | 上 | 吸 | 食 | 大 | 麻 | 剧 | 院 | 本 | 身 | 也 | 鼓 | 励 | 观 | 众 | 一 | 起 | 加 | 入 |',
  'num_samples': 152640,
  'gender': 'MALE'},
 {'id': 1862,
  'file_name': '6883634606271964216.wav',
  'raw_transcription': '美国联邦航空局 (FAA) 称,新一代航空运输系统 (NextGen) 可以使飞机缩短飞行航线,每年节省数百万加仑的燃料,并减少碳排放。',
  'transcription': '美 国 联 邦 航 空 局 faa 称 新 一 代 航 空 运 输 系 统 nextgen 可 以 使 飞 机 缩 短 飞 行 航 线 每 年 节 省 数 百 万 加 仑 的 燃 料 并 减 少 碳 排 放',
  '_': '美 | 国 | 联 | 邦 | 航 | 空 | 局 | f a a | 称 | 新 | 一 | 代 | 航 | 空 | 运 | 输 | 系 | 统 | n e x t g e n | 可 | 以 | 使 | 飞 | 机 | 缩 | 短 | 飞 | 行 | 航 | 线 | 每 | 年 | 节 | 省 | 数 | 百 | 万 | 加 | 仑 | 的 | 燃 | 料 | 并 | 减 | 少 | 碳 | 排 | 放 |',
  'num_samples': 206400,
  'gender': 'FEMALE'},
 {'id': 1862,
  'file_name': '14236617388250101268.wav',
  'raw_transcription': '美国联邦航空局 (FAA) 称,新一代航空运输系统 (NextGen) 可以使飞机缩短飞行航线,每年节省数百万加仑的燃料,并减少碳排放。',
  'transcription': '美 国 联 邦 航 空 局 faa 称 新 一 代 航 空 运 输 系 统 nextgen 可 以 使 飞 机 缩 短 飞 行 航 线 每 年 节 省 数 百 万 加 仑 的 燃 料 并 减 少 碳 排 放',
  '_': '美 | 国 | 联 | 邦 | 航 | 空 | 局 | f a a | 称 | 新 | 一 | 代 | 航 | 空 | 运 | 输 | 系 | 统 | n e x t g e n | 可 | 以 | 使 | 飞 | 机 | 缩 | 短 | 飞 | 行 | 航 | 线 | 每 | 年 | 节 | 省 | 数 | 百 | 万 | 加 | 仑 | 的 | 燃 | 料 | 并 | 减 | 少 | 碳 | 排 | 放 |',
  'num_samples': 330560,
  'gender': 'MALE'},
 {'id': 1862,
  'file_name': '13491680304484211022.wav',
  'raw_transcription': '美国联邦航空局 (FAA) 称,新一代航空运输系统 (NextGen) 可以使飞机缩短飞行航线,每年节省数百万加仑的燃料,并减少碳排放。',
  'transcription': '美 国 联 邦 航 空 局 faa 称 新 一 代 航 空 运 输 系 统 nextgen 可 以 使 飞 机 缩 短 飞 行 航 线 每 年 节 省 数 百 万 加 仑 的 燃 料 并 减 少 碳 排 放',
  '_': '美 | 国 | 联 | 邦 | 航 | 空 | 局 | f a a | 称 | 新 | 一 | 代 | 航 | 空 | 运 | 输 | 系 | 统 | n e x t g e n | 可 | 以 | 使 | 飞 | 机 | 缩 | 短 | 飞 | 行 | 航 | 线 | 每 | 年 | 节 | 省 | 数 | 百 | 万 | 加 | 仑 | 的 | 燃 | 料 | 并 | 减 | 少 | 碳 | 排 | 放 |',
  'num_samples': 289920,
  'gender': 'MALE'},
 {'id': 1992,
  'file_name': '5756643130279805197.wav',
  'raw_transcription': '“游猎 (safari)”一词,在常见的用法中是指通过陆路旅行去观赏令人惊叹的非洲野生动物,尤其是在热带草原上。',
  'transcription': '游 猎 safari 一 词 在 常 见 的 用 法 中 是 指 通 过 陆 路 旅 行 去 观 赏 令 人 惊 叹 的 非 洲 野 生 动 物 尤 其 是 在 热 带 草 原 上',
  '_': '游 | 猎 | s a f a r i | 一 | 词 | 在 | 常 | 见 | 的 | 用 | 法 | 中 | 是 | 指 | 通 | 过 | 陆 | 路 | 旅 | 行 | 去 | 观 | 赏 | 令 | 人 | 惊 | 叹 | 的 | 非 | 洲 | 野 | 生 | 动 | 物 | 尤 | 其 | 是 | 在 | 热 | 带 | 草 | 原 | 上 |',
  'num_samples': 178560,
  'gender': 'FEMALE'},
 {'id': 1992,
  'file_name': '2074081601399718426.wav',
  'raw_transcription': '“游猎 (safari)”一词,在常见的用法中是指通过陆路旅行去观赏令人惊叹的非洲野生动物,尤其是在热带草原上。',
  'transcription': '游 猎 safari 一 词 在 常 见 的 用 法 中 是 指 通 过 陆 路 旅 行 去 观 赏 令 人 惊 叹 的 非 洲 野 生 动 物 尤 其 是 在 热 带 草 原 上',
  '_': '游 | 猎 | s a f a r i | 一 | 词 | 在 | 常 | 见 | 的 | 用 | 法 | 中 | 是 | 指 | 通 | 过 | 陆 | 路 | 旅 | 行 | 去 | 观 | 赏 | 令 | 人 | 惊 | 叹 | 的 | 非 | 洲 | 野 | 生 | 动 | 物 | 尤 | 其 | 是 | 在 | 热 | 带 | 草 | 原 | 上 |',
  'num_samples': 223680,
  'gender': 'MALE'},
 {'id': 1874,
  'file_name': '1017060882143751441.wav',
  'raw_transcription': '有些人认为他是对的,但也有很多人持相反意见;他们认为太阳系是围绕着地球运转的,太阳也是(甚至其他恒星也是)。',
  'transcription': '有 些 人 认 为 他 是 对 的 但 也 有 很 多 人 持 相 反 意 见 他 们 认 为 太 阳 系 是 围 绕 着 地 球 运 转 的 太 阳 也 是 甚 至 其 他 恒 星 也 是',
  '_': '有 | 些 | 人 | 认 | 为 | 他 | 是 | 对 | 的 | 但 | 也 | 有 | 很 | 多 | 人 | 持 | 相 | 反 | 意 | 见 | 他 | 们 | 认 | 为 | 太 | 阳 | 系 | 是 | 围 | 绕 | 着 | 地 | 球 | 运 | 转 | 的 | 太 | 阳 | 也 | 是 | 甚 | 至 | 其 | 他 | 恒 | 星 | 也 | 是 |',
  'num_samples': 295040,
  'gender': 'MALE'},
 {'id': 1874,
  'file_name': '4874458478792019979.wav',
  'raw_transcription': '有些人认为他是对的,但也有很多人持相反意见;他们认为太阳系是围绕着地球运转的,太阳也是(甚至其他恒星也是)。',
  'transcription': '有 些 人 认 为 他 是 对 的 但 也 有 很 多 人 持 相 反 意 见 他 们 认 为 太 阳 系 是 围 绕 着 地 球 运 转 的 太 阳 也 是 甚 至 其 他 恒 星 也 是',
  '_': '有 | 些 | 人 | 认 | 为 | 他 | 是 | 对 | 的 | 但 | 也 | 有 | 很 | 多 | 人 | 持 | 相 | 反 | 意 | 见 | 他 | 们 | 认 | 为 | 太 | 阳 | 系 | 是 | 围 | 绕 | 着 | 地 | 球 | 运 | 转 | 的 | 太 | 阳 | 也 | 是 | 甚 | 至 | 其 | 他 | 恒 | 星 | 也 | 是 |',
  'num_samples': 275840,
  'gender': 'MALE'},
 {'id': 1965,
  'file_name': '11116223796032847225.wav',
  'raw_transcription': '这里几乎都是沙滩,游泳很安全,大部分地方都有新西兰圣诞树的树荫。',
  'transcription': '这 里 几 乎 都 是 沙 滩 游 泳 很 安 全 大 部 分 地 方 都 有 新 西 兰 圣 诞 树 的 树 荫',
  '_': '这 | 里 | 几 | 乎 | 都 | 是 | 沙 | 滩 | 游 | 泳 | 很 | 安 | 全 | 大 | 部 | 分 | 地 | 方 | 都 | 有 | 新 | 西 | 兰 | 圣 | 诞 | 树 | 的 | 树 | 荫 |',
  'num_samples': 201600,
  'gender': 'MALE'},
 {'id': 1965,
  'file_name': '15898916310547946633.wav',
  'raw_transcription': '这里几乎都是沙滩,游泳很安全,大部分地方都有新西兰圣诞树的树荫。',
  'transcription': '这 里 几 乎 都 是 沙 滩 游 泳 很 安 全 大 部 分 地 方 都 有 新 西 兰 圣 诞 树 的 树 荫',
  '_': '这 | 里 | 几 | 乎 | 都 | 是 | 沙 | 滩 | 游 | 泳 | 很 | 安 | 全 | 大 | 部 | 分 | 地 | 方 | 都 | 有 | 新 | 西 | 兰 | 圣 | 诞 | 树 | 的 | 树 | 荫 |',
  'num_samples': 145920,
  'gender': 'MALE'},
 {'id': 1965,
  'file_name': '10134195680525011353.wav',
  'raw_transcription': '这里几乎都是沙滩,游泳很安全,大部分地方都有新西兰圣诞树的树荫。',
  'transcription': '这 里 几 乎 都 是 沙 滩 游 泳 很 安 全 大 部 分 地 方 都 有 新 西 兰 圣 诞 树 的 树 荫',
  '_': '这 | 里 | 几 | 乎 | 都 | 是 | 沙 | 滩 | 游 | 泳 | 很 | 安 | 全 | 大 | 部 | 分 | 地 | 方 | 都 | 有 | 新 | 西 | 兰 | 圣 | 诞 | 树 | 的 | 树 | 荫 |',
  'num_samples': 109440,
  'gender': 'FEMALE'},
 {'id': 1831,
  'file_name': '13146698771660253766.wav',
  'raw_transcription': '普利特维茨湖国家公园森林茂密,主要树种有山毛榉、云杉和冷杉,并以高山和地中海植被混合为特色。',
  'transcription': '普 利 特 维 茨 湖 国 家 公 园 森 林 茂 密 主 要 树 种 有 山 毛 榉 云 杉 和 冷 杉 并 以 高 山 和 地 中 海 植 被 混 合 为 特 色',
  '_': '普 | 利 | 特 | 维 | 茨 | 湖 | 国 | 家 | 公 | 园 | 森 | 林 | 茂 | 密 | 主 | 要 | 树 | 种 | 有 | 山 | 毛 | 榉 | 云 | 杉 | 和 | 冷 | 杉 | 并 | 以 | 高 | 山 | 和 | 地 | 中 | 海 | 植 | 被 | 混 | 合 | 为 | 特 | 色 |',
  'num_samples': 252480,
  'gender': 'MALE'},
 {'id': 1831,
  'file_name': '13772234185513146781.wav',
  'raw_transcription': '普利特维茨湖国家公园森林茂密,主要树种有山毛榉、云杉和冷杉,并以高山和地中海植被混合为特色。',
  'transcription': '普 利 特 维 茨 湖 国 家 公 园 森 林 茂 密 主 要 树 种 有 山 毛 榉 云 杉 和 冷 杉 并 以 高 山 和 地 中 海 植 被 混 合 为 特 色',
  '_': '普 | 利 | 特 | 维 | 茨 | 湖 | 国 | 家 | 公 | 园 | 森 | 林 | 茂 | 密 | 主 | 要 | 树 | 种 | 有 | 山 | 毛 | 榉 | 云 | 杉 | 和 | 冷 | 杉 | 并 | 以 | 高 | 山 | 和 | 地 | 中 | 海 | 植 | 被 | 混 | 合 | 为 | 特 | 色 |',
  'num_samples': 319040,
  'gender': 'MALE'},
 {'id': 1831,
  'file_name': '7200295172149689914.wav',
  'raw_transcription': '普利特维茨湖国家公园森林茂密,主要树种有山毛榉、云杉和冷杉,并以高山和地中海植被混合为特色。',
  'transcription': '普 利 特 维 茨 湖 国 家 公 园 森 林 茂 密 主 要 树 种 有 山 毛 榉 云 杉 和 冷 杉 并 以 高 山 和 地 中 海 植 被 混 合 为 特 色',
  '_': '普 | 利 | 特 | 维 | 茨 | 湖 | 国 | 家 | 公 | 园 | 森 | 林 | 茂 | 密 | 主 | 要 | 树 | 种 | 有 | 山 | 毛 | 榉 | 云 | 杉 | 和 | 冷 | 杉 | 并 | 以 | 高 | 山 | 和 | 地 | 中 | 海 | 植 | 被 | 混 | 合 | 为 | 特 | 色 |',
  'num_samples': 226560,
  'gender': 'MALE'},
 {'id': 1675,
  'file_name': '13333464656670504120.wav',
  'raw_transcription': '除去表示您的“Sie”之外的所有名词都应以大写字母开头,即使在句子中间也应如此。',
  'transcription': '除 去 表 示 您 的 sie 之 外 的 所 有 名 词 都 应 以 大 写 字 母 开 头 即 使 在 句 子 中 间 也 应 如 此',
  '_': '除 | 去 | 表 | 示 | 您 | 的 | s i e | 之 | 外 | 的 | 所 | 有 | 名 | 词 | 都 | 应 | 以 | 大 | 写 | 字 | 母 | 开 | 头 | 即 | 使 | 在 | 句 | 子 | 中 | 间 | 也 | 应 | 如 | 此 |',
  'num_samples': 168000,
  'gender': 'MALE'},
 {'id': 1675,
  'file_name': '14998142402058888715.wav',
  'raw_transcription': '除去表示您的“Sie”之外的所有名词都应以大写字母开头,即使在句子中间也应如此。',
  'transcription': '除 去 表 示 您 的 sie 之 外 的 所 有 名 词 都 应 以 大 写 字 母 开 头 即 使 在 句 子 中 间 也 应 如 此',
  '_': '除 | 去 | 表 | 示 | 您 | 的 | s i e | 之 | 外 | 的 | 所 | 有 | 名 | 词 | 都 | 应 | 以 | 大 | 写 | 字 | 母 | 开 | 头 | 即 | 使 | 在 | 句 | 子 | 中 | 间 | 也 | 应 | 如 | 此 |',
  'num_samples': 182080,
  'gender': 'MALE'},
 {'id': 1675,
  'file_name': '5292075632880947876.wav',
  'raw_transcription': '除去表示您的“Sie”之外的所有名词都应以大写字母开头,即使在句子中间也应如此。',
  'transcription': '除 去 表 示 您 的 sie 之 外 的 所 有 名 词 都 应 以 大 写 字 母 开 头 即 使 在 句 子 中 间 也 应 如 此',
  '_': '除 | 去 | 表 | 示 | 您 | 的 | s i e | 之 | 外 | 的 | 所 | 有 | 名 | 词 | 都 | 应 | 以 | 大 | 写 | 字 | 母 | 开 | 头 | 即 | 使 | 在 | 句 | 子 | 中 | 间 | 也 | 应 | 如 | 此 |',
  'num_samples': 265280,
  'gender': 'MALE'},
 {'id': 1720,
  'file_name': '3025806273795483079.wav',
  'raw_transcription': '热巧克力达到了比利时的标准。果汁价格昂贵,但品质很好。',
  'transcription': '热 巧 克 力 达 到 了 比 利 时 的 标 准 果 汁 价 格 昂 贵 但 品 质 很 好',
  '_': '热 | 巧 | 克 | 力 | 达 | 到 | 了 | 比 | 利 | 时 | 的 | 标 | 准 | 果 | 汁 | 价 | 格 | 昂 | 贵 | 但 | 品 | 质 | 很 | 好 |',
  'num_samples': 197440,
  'gender': 'MALE'},
 {'id': 1720,
  'file_name': '7336178126089615612.wav',
  'raw_transcription': '热巧克力达到了比利时的标准。果汁价格昂贵,但品质很好。',
  'transcription': '热 巧 克 力 达 到 了 比 利 时 的 标 准 果 汁 价 格 昂 贵 但 品 质 很 好',
  '_': '热 | 巧 | 克 | 力 | 达 | 到 | 了 | 比 | 利 | 时 | 的 | 标 | 准 | 果 | 汁 | 价 | 格 | 昂 | 贵 | 但 | 品 | 质 | 很 | 好 |',
  'num_samples': 154560,
  'gender': 'MALE'},
 {'id': 1720,
  'file_name': '13436954706048324262.wav',
  'raw_transcription': '热巧克力达到了比利时的标准。果汁价格昂贵,但品质很好。',
  'transcription': '热 巧 克 力 达 到 了 比 利 时 的 标 准 果 汁 价 格 昂 贵 但 品 质 很 好',
  '_': '热 | 巧 | 克 | 力 | 达 | 到 | 了 | 比 | 利 | 时 | 的 | 标 | 准 | 果 | 汁 | 价 | 格 | 昂 | 贵 | 但 | 品 | 质 | 很 | 好 |',
  'num_samples': 110400,
  'gender': 'FEMALE'},
 {'id': 1958,
  'file_name': '5463450663016479724.wav',
  'raw_transcription': '这座城市与该国其他城市形成了鲜明对比,因为它更多的是阿拉伯风格,而不是非洲风格。',
  'transcription': '这 座 城 市 与 该 国 其 他 城 市 形 成 了 鲜 明 对 比 因 为 它 更 多 的 是 阿 拉 伯 风 格 而 不 是 非 洲 风 格',
  '_': '这 | 座 | 城 | 市 | 与 | 该 | 国 | 其 | 他 | 城 | 市 | 形 | 成 | 了 | 鲜 | 明 | 对 | 比 | 因 | 为 | 它 | 更 | 多 | 的 | 是 | 阿 | 拉 | 伯 | 风 | 格 | 而 | 不 | 是 | 非 | 洲 | 风 | 格 |',
  'num_samples': 209280,
  'gender': 'MALE'},
 {'id': 1958,
  'file_name': '10480388653191520950.wav',
  'raw_transcription': '这座城市与该国其他城市形成了鲜明对比,因为它更多的是阿拉伯风格,而不是非洲风格。',
  'transcription': '这 座 城 市 与 该 国 其 他 城 市 形 成 了 鲜 明 对 比 因 为 它 更 多 的 是 阿 拉 伯 风 格 而 不 是 非 洲 风 格',
  '_': '这 | 座 | 城 | 市 | 与 | 该 | 国 | 其 | 他 | 城 | 市 | 形 | 成 | 了 | 鲜 | 明 | 对 | 比 | 因 | 为 | 它 | 更 | 多 | 的 | 是 | 阿 | 拉 | 伯 | 风 | 格 | 而 | 不 | 是 | 非 | 洲 | 风 | 格 |',
  'num_samples': 154560,
  'gender': 'MALE'},
 {'id': 1958,
  'file_name': '5922866768874351771.wav',
  'raw_transcription': '这座城市与该国其他城市形成了鲜明对比,因为它更多的是阿拉伯风格,而不是非洲风格。',
  'transcription': '这 座 城 市 与 该 国 其 他 城 市 形 成 了 鲜 明 对 比 因 为 它 更 多 的 是 阿 拉 伯 风 格 而 不 是 非 洲 风 格',
  '_': '这 | 座 | 城 | 市 | 与 | 该 | 国 | 其 | 他 | 城 | 市 | 形 | 成 | 了 | 鲜 | 明 | 对 | 比 | 因 | 为 | 它 | 更 | 多 | 的 | 是 | 阿 | 拉 | 伯 | 风 | 格 | 而 | 不 | 是 | 非 | 洲 | 风 | 格 |',
  'num_samples': 119040,
  'gender': 'FEMALE'},
 {'id': 1723,
  'file_name': '15574694116276939010.wav',
  'raw_transcription': '该海湾曾在 1889 年发生过一场臭名昭著的海军对峙,当时来自德国、美国和英国的七艘舰船拒绝驶离这个海湾。',
  'transcription': '该 海 湾 曾 在 1889 年 发 生 过 一 场 臭 名 昭 著 的 海 军 对 峙 当 时 来 自 德 国 美 国 和 英 国 的 七 艘 舰 船 拒 绝 驶 离 这 个 海 湾',
  '_': '该 | 海 | 湾 | 曾 | 在 | 1 8 8 9 | 年 | 发 | 生 | 过 | 一 | 场 | 臭 | 名 | 昭 | 著 | 的 | 海 | 军 | 对 | 峙 | 当 | 时 | 来 | 自 | 德 | 国 | 美 | 国 | 和 | 英 | 国 | 的 | 七 | 艘 | 舰 | 船 | 拒 | 绝 | 驶 | 离 | 这 | 个 | 海 | 湾 |',
  'num_samples': 253440,
  'gender': 'MALE'},
 {'id': 1723,
  'file_name': '17753976263586987851.wav',
  'raw_transcription': '该海湾曾在 1889 年发生过一场臭名昭著的海军对峙,当时来自德国、美国和英国的七艘舰船拒绝驶离这个海湾。',
  'transcription': '该 海 湾 曾 在 1889 年 发 生 过 一 场 臭 名 昭 著 的 海 军 对 峙 当 时 来 自 德 国 美 国 和 英 国 的 七 艘 舰 船 拒 绝 驶 离 这 个 海 湾',
  '_': '该 | 海 | 湾 | 曾 | 在 | 1 8 8 9 | 年 | 发 | 生 | 过 | 一 | 场 | 臭 | 名 | 昭 | 著 | 的 | 海 | 军 | 对 | 峙 | 当 | 时 | 来 | 自 | 德 | 国 | 美 | 国 | 和 | 英 | 国 | 的 | 七 | 艘 | 舰 | 船 | 拒 | 绝 | 驶 | 离 | 这 | 个 | 海 | 湾 |',
  'num_samples': 253120,
  'gender': 'MALE'},
 {'id': 1723,
  'file_name': '10824731430851864186.wav',
  'raw_transcription': '该海湾曾在 1889 年发生过一场臭名昭著的海军对峙,当时来自德国、美国和英国的七艘舰船拒绝驶离这个海湾。',
  'transcription': '该 海 湾 曾 在 1889 年 发 生 过 一 场 臭 名 昭 著 的 海 军 对 峙 当 时 来 自 德 国 美 国 和 英 国 的 七 艘 舰 船 拒 绝 驶 离 这 个 海 湾',
  '_': '该 | 海 | 湾 | 曾 | 在 | 1 8 8 9 | 年 | 发 | 生 | 过 | 一 | 场 | 臭 | 名 | 昭 | 著 | 的 | 海 | 军 | 对 | 峙 | 当 | 时 | 来 | 自 | 德 | 国 | 美 | 国 | 和 | 英 | 国 | 的 | 七 | 艘 | 舰 | 船 | 拒 | 绝 | 驶 | 离 | 这 | 个 | 海 | 湾 |',
  'num_samples': 196800,
  'gender': 'FEMALE'},
 {'id': 1758,
  'file_name': '3992452798174376877.wav',
  'raw_transcription': '该群岛位于南极半岛以北 120 公里处。最大的岛屿是乔治国王岛,这里是“繁星村(Villa Las Estrellas)”的定居点。',
  'transcription': '该 群 岛 位 于 南 极 半 岛 以 北 120 公 里 处 最 大 的 岛 屿 是 乔 治 国 王 岛 这 里 是 繁 星 村 villa las estrellas 的 定 居 点',
  '_': '该 | 群 | 岛 | 位 | 于 | 南 | 极 | 半 | 岛 | 以 | 北 | 1 2 0 | 公 | 里 | 处 | 最 | 大 | 的 | 岛 | 屿 | 是 | 乔 | 治 | 国 | 王 | 岛 | 这 | 里 | 是 | 繁 | 星 | 村 | v i l l a | l a s | e s t r e l l a s | 的 | 定 | 居 | 点 |',
  'num_samples': 192960,
  'gender': 'MALE'},
 {'id': 1758,
  'file_name': '6061457568853391155.wav',
  'raw_transcription': '该群岛位于南极半岛以北 120 公里处。最大的岛屿是乔治国王岛,这里是“繁星村(Villa Las Estrellas)”的定居点。',
  'transcription': '该 群 岛 位 于 南 极 半 岛 以 北 120 公 里 处 最 大 的 岛 屿 是 乔 治 国 王 岛 这 里 是 繁 星 村 villa las estrellas 的 定 居 点',
  '_': '该 | 群 | 岛 | 位 | 于 | 南 | 极 | 半 | 岛 | 以 | 北 | 1 2 0 | 公 | 里 | 处 | 最 | 大 | 的 | 岛 | 屿 | 是 | 乔 | 治 | 国 | 王 | 岛 | 这 | 里 | 是 | 繁 | 星 | 村 | v i l l a | l a s | e s t r e l l a s | 的 | 定 | 居 | 点 |',
  'num_samples': 203520,
  'gender': 'MALE'},
 {'id': 1758,
  'file_name': '7515396919406582813.wav',
  'raw_transcription': '该群岛位于南极半岛以北 120 公里处。最大的岛屿是乔治国王岛,这里是“繁星村(Villa Las Estrellas)”的定居点。',
  'transcription': '该 群 岛 位 于 南 极 半 岛 以 北 120 公 里 处 最 大 的 岛 屿 是 乔 治 国 王 岛 这 里 是 繁 星 村 villa las estrellas 的 定 居 点',
  '_': '该 | 群 | 岛 | 位 | 于 | 南 | 极 | 半 | 岛 | 以 | 北 | 1 2 0 | 公 | 里 | 处 | 最 | 大 | 的 | 岛 | 屿 | 是 | 乔 | 治 | 国 | 王 | 岛 | 这 | 里 | 是 | 繁 | 星 | 村 | v i l l a | l a s | e s t r e l l a s | 的 | 定 | 居 | 点 |',
  'num_samples': 128640,
  'gender': 'FEMALE'},
 {'id': 1955,
  'file_name': '11497946787253221842.wav',
  'raw_transcription': '多发性硬化是一种影响中枢神经系统(由脑、脊髓和视神经组成)的疾病。',
  'transcription': '多 发 性 硬 化 是 一 种 影 响 中 枢 神 经 系 统 由 脑 脊 髓 和 视 神 经 组 成 的 疾 病',
  '_': '多 | 发 | 性 | 硬 | 化 | 是 | 一 | 种 | 影 | 响 | 中 | 枢 | 神 | 经 | 系 | 统 | 由 | 脑 | 脊 | 髓 | 和 | 视 | 神 | 经 | 组 | 成 | 的 | 疾 | 病 |',
  'num_samples': 211520,
  'gender': 'MALE'},
 {'id': 1702,
  'file_name': '7282051172441409999.wav',
  'raw_transcription': '仅仅两个星期,美国和自由法国的军队就解放了法国南部,并转向德国。',
  'transcription': '仅 仅 两 个 星 期 美 国 和 自 由 法 国 的 军 队 就 解 放 了 法 国 南 部 并 转 向 德 国',
  '_': '仅 | 仅 | 两 | 个 | 星 | 期 | 美 | 国 | 和 | 自 | 由 | 法 | 国 | 的 | 军 | 队 | 就 | 解 | 放 | 了 | 法 | 国 | 南 | 部 | 并 | 转 | 向 | 德 | 国 |',
  'num_samples': 253120,
  'gender': 'MALE'},
 {'id': 1702,
  'file_name': '1559221826082132977.wav',
  'raw_transcription': '仅仅两个星期,美国和自由法国的军队就解放了法国南部,并转向德国。',
  'transcription': '仅 仅 两 个 星 期 美 国 和 自 由 法 国 的 军 队 就 解 放 了 法 国 南 部 并 转 向 德 国',
  '_': '仅 | 仅 | 两 | 个 | 星 | 期 | 美 | 国 | 和 | 自 | 由 | 法 | 国 | 的 | 军 | 队 | 就 | 解 | 放 | 了 | 法 | 国 | 南 | 部 | 并 | 转 | 向 | 德 | 国 |',
  'num_samples': 178240,
  'gender': 'MALE'},
 {'id': 1702,
  'file_name': '8171071251740175059.wav',
  'raw_transcription': '仅仅两个星期,美国和自由法国的军队就解放了法国南部,并转向德国。',
  'transcription': '仅 仅 两 个 星 期 美 国 和 自 由 法 国 的 军 队 就 解 放 了 法 国 南 部 并 转 向 德 国',
  '_': '仅 | 仅 | 两 | 个 | 星 | 期 | 美 | 国 | 和 | 自 | 由 | 法 | 国 | 的 | 军 | 队 | 就 | 解 | 放 | 了 | 法 | 国 | 南 | 部 | 并 | 转 | 向 | 德 | 国 |',
  'num_samples': 270400,
  'gender': 'MALE'},
 {'id': 1891,
  'file_name': '14374188311472206884.wav',
  'raw_transcription': '拉卡·辛格 (Lakkha Singh) 还介绍了 chhappan bhog bhajan。歌手 Raju Khandelwal 陪同他身边。',
  'transcription': '拉 卡 辛 格 lakkha singh 还 介 绍 了 chhappan bhog bhajan 歌 手 raju khandelwal 陪 同 他 身 边',
  '_': '拉 | 卡 | 辛 | 格 | l a k k h a | s i n g h | 还 | 介 | 绍 | 了 | c h h a p p a n | b h o g | b h a j a n | 歌 | 手 | r a j u | k h a n d e l w a l | 陪 | 同 | 他 | 身 | 边 |',
  'num_samples': 331840,
  'gender': 'MALE'},
 {'id': 1924,
  'file_name': '288222503248548843.wav',
  'raw_transcription': '女子坐式组的四名滑雪选手未能完赛,大回转项目(Giant Slalom)的 117 名选手中有 45 人未能挤进榜单。',
  'transcription': '女 子 坐 式 组 的 四 名 滑 雪 选 手 未 能 完 赛 大 回 转 项 目 giant slalom 的 117 名 选 手 中 有 45 人 未 能 挤 进 榜 单',
  '_': '女 | 子 | 坐 | 式 | 组 | 的 | 四 | 名 | 滑 | 雪 | 选 | 手 | 未 | 能 | 完 | 赛 | 大 | 回 | 转 | 项 | 目 | g i a n t | s l a l o m | 的 | 1 1 7 | 名 | 选 | 手 | 中 | 有 | 4 5 | 人 | 未 | 能 | 挤 | 进 | 榜 | 单 |',
  'num_samples': 154560,
  'gender': 'FEMALE'},
 {'id': 1924,
  'file_name': '2512442429278456870.wav',
  'raw_transcription': '女子坐式组的四名滑雪选手未能完赛,大回转项目(Giant Slalom)的 117 名选手中有 45 人未能挤进榜单。',
  'transcription': '女 子 坐 式 组 的 四 名 滑 雪 选 手 未 能 完 赛 大 回 转 项 目 giant slalom 的 117 名 选 手 中 有 45 人 未 能 挤 进 榜 单',
  '_': '女 | 子 | 坐 | 式 | 组 | 的 | 四 | 名 | 滑 | 雪 | 选 | 手 | 未 | 能 | 完 | 赛 | 大 | 回 | 转 | 项 | 目 | g i a n t | s l a l o m | 的 | 1 1 7 | 名 | 选 | 手 | 中 | 有 | 4 5 | 人 | 未 | 能 | 挤 | 进 | 榜 | 单 |',
  'num_samples': 213120,
  'gender': 'MALE'},
 {'id': 1924,
  'file_name': '530281066718740151.wav',
  'raw_transcription': '女子坐式组的四名滑雪选手未能完赛,大回转项目(Giant Slalom)的 117 名选手中有 45 人未能挤进榜单。',
  'transcription': '女 子 坐 式 组 的 四 名 滑 雪 选 手 未 能 完 赛 大 回 转 项 目 giant slalom 的 117 名 选 手 中 有 45 人 未 能 挤 进 榜 单',
  '_': '女 | 子 | 坐 | 式 | 组 | 的 | 四 | 名 | 滑 | 雪 | 选 | 手 | 未 | 能 | 完 | 赛 | 大 | 回 | 转 | 项 | 目 | g i a n t | s l a l o m | 的 | 1 1 7 | 名 | 选 | 手 | 中 | 有 | 4 5 | 人 | 未 | 能 | 挤 | 进 | 榜 | 单 |',
  'num_samples': 260480,
  'gender': 'MALE'},
 {'id': 1838,
  'file_name': '6463880991756566513.wav',
  'raw_transcription': '吉萨大金字塔是七大奇迹中唯一至今仍屹立不倒的建筑。',
  'transcription': '吉 萨 大 金 字 塔 是 七 大 奇 迹 中 唯 一 至 今 仍 屹 立 不 倒 的 建 筑',
  '_': '吉 | 萨 | 大 | 金 | 字 | 塔 | 是 | 七 | 大 | 奇 | 迹 | 中 | 唯 | 一 | 至 | 今 | 仍 | 屹 | 立 | 不 | 倒 | 的 | 建 | 筑 |',
  'num_samples': 117120,
  'gender': 'MALE'},
 {'id': 1838,
  'file_name': '1554567208905920344.wav',
  'raw_transcription': '吉萨大金字塔是七大奇迹中唯一至今仍屹立不倒的建筑。',
  'transcription': '吉 萨 大 金 字 塔 是 七 大 奇 迹 中 唯 一 至 今 仍 屹 立 不 倒 的 建 筑',
  '_': '吉 | 萨 | 大 | 金 | 字 | 塔 | 是 | 七 | 大 | 奇 | 迹 | 中 | 唯 | 一 | 至 | 今 | 仍 | 屹 | 立 | 不 | 倒 | 的 | 建 | 筑 |',
  'num_samples': 96960,
  'gender': 'FEMALE'},
 {'id': 1697,
  'file_name': '16704409640833254127.wav',
  'raw_transcription': '他一直无法用药物来缓解疼痛,因为比赛禁止参赛者服用这些药物。',
  'transcription': '他 一 直 无 法 用 药 物 来 缓 解 疼 痛 因 为 比 赛 禁 止 参 赛 者 服 用 这 些 药 物',
  '_': '他 | 一 | 直 | 无 | 法 | 用 | 药 | 物 | 来 | 缓 | 解 | 疼 | 痛 | 因 | 为 | 比 | 赛 | 禁 | 止 | 参 | 赛 | 者 | 服 | 用 | 这 | 些 | 药 | 物 |',
  'num_samples': 131520,
  'gender': 'MALE'},
 {'id': 1697,
  'file_name': '2009318326155613549.wav',
  'raw_transcription': '他一直无法用药物来缓解疼痛,因为比赛禁止参赛者服用这些药物。',
  'transcription': '他 一 直 无 法 用 药 物 来 缓 解 疼 痛 因 为 比 赛 禁 止 参 赛 者 服 用 这 些 药 物',
  '_': '他 | 一 | 直 | 无 | 法 | 用 | 药 | 物 | 来 | 缓 | 解 | 疼 | 痛 | 因 | 为 | 比 | 赛 | 禁 | 止 | 参 | 赛 | 者 | 服 | 用 | 这 | 些 | 药 | 物 |',
  'num_samples': 177280,
  'gender': 'MALE'},
 {'id': 1697,
  'file_name': '10674527227632117693.wav',
  'raw_transcription': '他一直无法用药物来缓解疼痛,因为比赛禁止参赛者服用这些药物。',
  'transcription': '他 一 直 无 法 用 药 物 来 缓 解 疼 痛 因 为 比 赛 禁 止 参 赛 者 服 用 这 些 药 物',
  '_': '他 | 一 | 直 | 无 | 法 | 用 | 药 | 物 | 来 | 缓 | 解 | 疼 | 痛 | 因 | 为 | 比 | 赛 | 禁 | 止 | 参 | 赛 | 者 | 服 | 用 | 这 | 些 | 药 | 物 |',
  'num_samples': 156480,
  'gender': 'MALE'},
 {'id': 1973,
  'file_name': '9875306761103765169.wav',
  'raw_transcription': '但由于处在赤道以北几度的“高热带”,你将需要同时应对高温(终年)和强烈的阳光(天气晴朗时,这种情况相对较少)。',
  'transcription': '但 由 于 处 在 赤 道 以 北 几 度 的 高 热 带 你 将 需 要 同 时 应 对 高 温 终 年 和 强 烈 的 阳 光 天 气 晴 朗 时 这 种 情 况 相 对 较 少',
  '_': '但 | 由 | 于 | 处 | 在 | 赤 | 道 | 以 | 北 | 几 | 度 | 的 | 高 | 热 | 带 | 你 | 将 | 需 | 要 | 同 | 时 | 应 | 对 | 高 | 温 | 终 | 年 | 和 | 强 | 烈 | 的 | 阳 | 光 | 天 | 气 | 晴 | 朗 | 时 | 这 | 种 | 情 | 况 | 相 | 对 | 较 | 少 |',
  'num_samples': 167040,
  'gender': 'FEMALE'},
 {'id': 1973,
  'file_name': '15672644474893056331.wav',
  'raw_transcription': '但由于处在赤道以北几度的“高热带”,你将需要同时应对高温(终年)和强烈的阳光(天气晴朗时,这种情况相对较少)。',
  'transcription': '但 由 于 处 在 赤 道 以 北 几 度 的 高 热 带 你 将 需 要 同 时 应 对 高 温 终 年 和 强 烈 的 阳 光 天 气 晴 朗 时 这 种 情 况 相 对 较 少',
  '_': '但 | 由 | 于 | 处 | 在 | 赤 | 道 | 以 | 北 | 几 | 度 | 的 | 高 | 热 | 带 | 你 | 将 | 需 | 要 | 同 | 时 | 应 | 对 | 高 | 温 | 终 | 年 | 和 | 强 | 烈 | 的 | 阳 | 光 | 天 | 气 | 晴 | 朗 | 时 | 这 | 种 | 情 | 况 | 相 | 对 | 较 | 少 |',
  'num_samples': 183360,
  'gender': 'FEMALE'},
 {'id': 1973,
  'file_name': '2262135194517439894.wav',
  'raw_transcription': '但由于处在赤道以北几度的“高热带”,你将需要同时应对高温(终年)和强烈的阳光(天气晴朗时,这种情况相对较少)。',
  'transcription': '但 由 于 处 在 赤 道 以 北 几 度 的 高 热 带 你 将 需 要 同 时 应 对 高 温 终 年 和 强 烈 的 阳 光 天 气 晴 朗 时 这 种 情 况 相 对 较 少',
  '_': '但 | 由 | 于 | 处 | 在 | 赤 | 道 | 以 | 北 | 几 | 度 | 的 | 高 | 热 | 带 | 你 | 将 | 需 | 要 | 同 | 时 | 应 | 对 | 高 | 温 | 终 | 年 | 和 | 强 | 烈 | 的 | 阳 | 光 | 天 | 气 | 晴 | 朗 | 时 | 这 | 种 | 情 | 况 | 相 | 对 | 较 | 少 |',
  'num_samples': 167040,
  'gender': 'FEMALE'}]

Running inference on the dataset using a medium Whisper model

The following will take a few minutes to transcribe and translate utterances in the dataset.

model = whisper.load_model("medium")
print(
    f"Model is {'multilingual' if model.is_multilingual else 'English-only'} "
    f"and has {sum(np.prod(p.shape) for p in model.parameters()):,} parameters."
)
100%|█████████████████████████████████████| 1.42G/1.42G [00:32<00:00, 46.5MiB/s]
Model is multilingual and has 762,321,920 parameters.
options = dict(language=language, beam_size=5, best_of=5)
transcribe_options = dict(task="transcribe", **options)
translate_options = dict(task="translate", **options)
references = []
transcriptions = []
translations = []

for audio, text in tqdm(dataset):
    transcription = model.transcribe(audio, **transcribe_options)["text"]
    translation = model.transcribe(audio, **translate_options)["text"]
    
    transcriptions.append(transcription)
    translations.append(translation)
    references.append(text)
data = pd.DataFrame(dict(reference=references, transcription=transcriptions, translation=translations))
data
reference transcription translation
0 特朗普与土耳其总统雷杰普·塔伊普·埃尔多安recep tayyip erdoğan通话后发表了声明 特朗普與土耳其總統雷傑普塔伊普埃爾多安通話後發表了聲明 Trump and Turkish President Recep Tayyip Erdogan made a statement after the call.
1 他 受 到 了 新 加 坡 副 总 理 黄 根 成 的 欢 迎 并 与 新 加 坡 总 理 李 显 龙 探 讨 了 贸 易 和 恐 怖 主 义 问 题 他受到了新加坡副总理黄根成的欢迎,并与新加坡总理李显龙探讨了贸易和恐怖主义问题。 He was welcomed by the Deputy Prime Minister of Singapore, Huang Gencheng, and discussed trade and terrorism issues with Singapore Prime Minister Lee Hsien Loong.
2 虽 然 有 一 种 实 验 性 疫 苗 看 似 能 够 降 低 埃 博 拉 病 毒 的 死 亡 率 但 迄 今 为 止 还 没 明 确 证 明 任 何 药 物 适 合 治 疗 现 有 的 感 染 虽然有一种实验性疫苗看似能够降低埃博拉病毒的死亡率,但迄今为止还没明确证明任何药物适合治疗现有的感染。 Although there is an experimental vaccine that seems to be able to reduce the death rate of the Ebola virus, so far, it has not clearly proven that any drug is suitable for the current infection.
3 场 景 在 金 字 塔 上 展 示 不 同 的 金 字 塔 被 点 亮 场景在金字塔上展示不同的金字塔被点亮 The scene is displayed on the crystal tower, and different crystals are lit.
4 同 理 有 了 申 根 签 证 你 就 不 必 分 别 向 每 个 申 根 成 员 国 申 请 签 证 从 而 节 省 了 时 间 金 钱 和 手 续 同理,有了申根签证,你就不必分别向每个申根成员国申请签证,从而节省了时间、金钱和手续。 In the same way, you don't have to apply for a visa to each member of the deep root member state if you have a deep root visa, which saves time, money and procedures.
5 昨 日 上 午 土 耳 其 加 齐 安 泰 普 gaziantep 的 警 察 总 部 发 生 了 一 起 汽 车 炸 弹 爆 炸 事 件 该 事 件 导 致 两 名 警 察 死 亡 20 余 人 受 伤 昨日上午,土耳其加奇安泰普的警察总部发生了一起汽车爆炸事件,该事件导致两名警察死亡,二十余人受伤。 Yesterday morning, a car explosion occurred in the headquarter of the police in Turkey's Gaci Antep, which led to the death of two police officers and the injury of more than 20 people.
6 州 长 办 公 室 表 示 伤 者 中 有 十 九 人 是 警 察 州长办公室表示,伤者中19人是警察 The governor's office said that 19 of the injured were police officers.
7 文 明 是 一 种 由 共 同 生 活 合 作 工 作 的 人 群 社 会 所 共 享 的 单 一 文 化 文明是一种由共同生活合作工作的人群社会所共享的单一文化 Civilization is a single culture shared by a community society that cooperates with each other in life and work.
8 随 着 希 腊 知 识 的 衰 落 西 方 脱 离 了 其 希 腊 哲 学 和 科 学 根 源 随着希腊知识的衰落,西方脱离了其希腊哲学和科学根源。 With the fall of Greek knowledge, the West distanced itself from its Greek philosophy and scientific roots.
9 早 年 该 节 目 仅 在 运 营 已 久 的 互 联 网 广 播 网 站 toginet radio 上 播 出 toginet radio 是 一 个 专 注 于 谈 话 广 播 的 网 站 早年,该节目仅在运营已久的互联网广播网站TGNet Radio上播出,TGNet Radio是一个专注于谈话广播的网站。 In the early years, this program was only available on the TGNet Radio, an online broadcasting website that has been in operation for a long time.
10 在 由 茅 茅 运 动 为 争 取 独 立 而 组 织 发 起 的 斗 争 中 该 镇 的 一 场 和 平 集 会 致 使 大 酋 长 图 普 阿 塔 马 塞 塞 利 罗 菲 三 世 tupua tamasese lealofi iii 遇 害 身 亡 在由毛毛运动为争取独立而组织发起的斗争中,该阵的一场和平集会致使大酋长普土阿塔玛塞塞利罗菲三世遇害身亡。 In the struggle of Mao Mao movement to fight for independence and organization, a peaceful assembly of the government led to the death of the leader of the big ball, Putua Tama Saisai Lilofei III.
11 支 架 式 教 学 不 是 一 种 学 习 方 法 而 是 一 种 辅 助 刚 学 习 使 用 新 电 脑 程 序 或 启 动 新 项 目 的 人 的 手 段 支架式教学不是一种学习方法,而是一种辅助刚学习使用新电脑程序或启动新项目的人的手段。 Instructional teaching is not a learning method, but a means to assist people who have just learned to use new computer programs or start new projects.
12 1990 年 由 于 沙 漠 的 威 胁 它 被 列 入 了 濒 危 世 界 遗 产 名 录 1990年,由于沙漠的威胁,它被列入了宾威世界遗产名录。 In 1990, due to the threat of the desert, it was included in the World Heritage List of Binwei.
13 有 些 原 子 含 有 不 稳 定 的 原 子 核 这 意 味 着 它 们 很 可 能 会 在 很 少 或 没 有 刺 激 的 情 况 下 发 生 分 裂 有些原子含有不稳定的原子核,这意味着它们很可能会在很少或没有刺激的情况下发射分裂。 There are some particles that are not stable, which means that they may split up in less or less exciting situations.
14 29 岁 的 malar balasubramanian 医 生 在 俄 亥 俄 州 辛 辛 那 提 市 以 北 约 15 英 里 的 郊 区 布 鲁 艾 施 被 发 现 她 被 找 到 时 身 穿 t 恤 衫 和 内 裤 躺 在 路 边 的 地 上 看 上 去 服 用 了 大 量 药 物 29岁的马拉巴拉斯巴拉曼尼医生,在俄亥俄州辛辛纳提市以北约15英里的郊区布鲁艾斯被发现,他被找到时身穿T恤衫和内裤,躺在路边的地上,看上去服用了大量药物。 The 29 year old Mala Balasparamanidze was found in the northern part of the city of Sinxingnati, Ohio, 15 miles from the village of Buru Eish. When he was found, he was wearing a T shirt and underwear, lying on the ground on the side of the road, looking like he was taking a lot of drugs.
15 山 羊 似 乎 是 1 万 年 前 左 右 在 伊 朗 的 扎 格 罗 斯 山 脉 首 次 被 驯 养 的 山羊似乎是一万年前左右在伊朗的扎格罗斯山脉首次被熏养的 The mountain goat seems to be about 10,000 years old. This is the first time the mountain goat has been cremated in Zagros, Iran.
16 如 果 你 不 习 惯 在 乡 村 道 路 上 开 车 那 可 要 保 持 头 脑 清 醒 这 里 到 处 都 是 陡 坡 窄 车 道 和 急 转 弯 如果你不习惯在乡村道路上开车那可要保持头脑清醒这里到处都是陡坡载车道和急转弯 If you are not used to driving on the road in the village, you should keep your mind clear. There are steep slopes everywhere, and you will find yourself not on the right track.
17 很 多 人 认 为 它 们 并 非 恐 龙 因 为 它 们 有 羽 毛 会 飞 很多人认为它们并非恐龙,因为它们有羽毛,会飞 Many people think they are not dinosaurs because they have feathers and can fly.
18 起 初 他 被 送 往 位 于 大 雅 茅 斯 的 詹 姆 斯 佩 吉 特 医 院 进 行 救 治 起初他被送往位於大雅茅斯的詹姆斯佩吉特醫院進行救治 At the beginning, he was sent to the James Paget Hospital in Dallas.
19 例 如 世 界 上 最 常 见 的 静 态 图 像 摄 影 格 式 是 35mm 格 式 这 是 胶 片 电 影 时 代 末 期 占 主 导 地 位 的 电 影 尺 寸 例如,世界上最常見的靜態圖像攝影格式是35mm格式,這是膠片電影時代末期佔主導地位的電影尺寸。 For example, the most common static image shooting format in the world is 35mm format. This is the film size that is the leading position of film and film movies in the late 70s.
20 虽然这通常只是一种不准确的刻板印象但在巴黎生活的最佳方式仍然是尽量举止得当表现得像一个有 bien élevé”教养良好的人这会让参加社会活动变得容易得多 虽然这通常只是一种不准确的刻板印象,但在巴黎生活的最佳方式,仍然是举止尽量妥当,表现着像一个有教养良好的人,这会让参加社会活动变得容易得罗。 Although this is usually just an inaccurate objective impression, the best way to live in Paris is still to try your best to behave like a person with a good education, which will make it easy for you to participate in social activities.
21 尽 管 如 此 还 是 要 听 从 有 关 部 门 的 建 议 遵 守 所 有 的 标 志 并 密 切 注 意 安 全 警 告 尽管如此,还是要听从有关部门的建议,遵守所有标志并密切注意安全警告。 In this case, we should listen to the advice of the relevant departments, follow all the signs, and pay close attention to safety warnings.
22 山 区 夏 令 时 晚 上 10 点 到 11 点 之 间 院 子 里 的 犯 人 们 引 发 了 一 场 火 灾 山居下令時晚上10點到11點之間院子裡的犯人們引發了一場火災 Between 10pm and 11pm, the prisoners in the yard caused a fire.
23 除 了 清 澈 美 丽 的 天 空 和 周 围 的 群 山 什 么 也 看 不 见 在 洞 穴 中 几 乎 看 不 到 也 听 不 到 外 界 的 景 象 和 声 音 除了清澈美丽的天空和周围的群山什么也看不见在洞穴中几乎看不到也听不到外界的景象和声音 In addition to the beautiful sky and the surrounding mountains, you can't see anything in the cave. You can hardly see or hear the scenery and sounds of the outside world.
24 巴 塞 罗 那 的 官 方 语 言 为 加 泰 罗 尼 亚 语 和 西 班 牙 语 大 约 一 半 的 当 地 人 更 愿 意 说 加 泰 罗 尼 亚 语 绝 大 多 数 人 都 听 懂 加 泰 罗 尼 亚 语 至 于 西 班 牙 语 几 乎 每 个 人 都 能 听 懂 巴塞尔罗那的官方语言为加泰罗尼亚语和西班牙语,大概一半的当地人更愿意说加泰罗尼亚语,绝大多数人都听得懂加泰罗尼亚语,甚至于西班牙语,几乎每个人都能听懂。 Barcelona's official languages are Catalan and Spanish. About half of the locals are more willing to speak Catalan. Most people can understand Catalan. Even Spanish, almost everyone can understand it.
25 圣 彼 得 堡 游 轮 包 括 城 内 观 光 活 动 游 轮 乘 客 可 获 豁 免 签 证 详 情 请 参 阅 服 务 条 款 圣彼得堡邮轮包括城内观光活动邮轮乘客可豁免签证详情请参与服务条款 The Saint Peter's oil wheels include city tour activities. The passenger of the oil wheels can be exempt from visa. For more information, please refer to the terms of service.
26 拒 绝 男 人 时 要 坚 定 别 害 怕 坚 持 自 己 的 立 场 不 管 文 化 有 无 差 异 都 要 果 断 回 绝 拒絕男人時要堅定,別害怕堅持自己的立場,不管文化有無差異,都要果斷回絕。 When you reject a man, you must be firm. Don't be afraid to stick to your position. No matter if the culture has no difference, you must be determined to reject it.
27 跳 羚 队 以 五 连 败 收 官 跳零队115连败 收官
28 狮 子 是 群 居 属 性 最 明 显 的 猫 科 动 物 生 活 在 称 为 狮 群 的 大 型 群 体 中 狮子是群居属性最明显的猫科动物生活在称为狮群的大型群体中 The lion is the most obvious animal in the group, living in a large group called the lion group.
29 亚 马 逊 河 占 全 世 界 所 有 河 流 的 入 海 流 量 的 20% 亚马逊河占全世界所有河流的入海流量的20% Amazon River accounts for 20% of all rivers in the world.
30 综 上 所 述 如 果 我 们 的 祖 先 解 决 蛋 白 质 问 题 的 途 径 与 如 今 热 带 草 原 上 的 黑 猩 猩 所 使 用 的 方 法 无 异 我 们 也 不 应 该 感 到 惊 讶 综上所述,如果我们的祖先解决蛋白质问题的途径与如今热带草原上的黑猩猩所使用的方法无异,我们也不应该感到惊讶。 In summary, if our ancestors solved the problem of protein and the method of using the black star on the grassland, we should not be surprised.
31 适 当 使 用 博 客 可 以 使 学 生 变 得 更 善 于 分 析 和 进 行 思 辨 通 过 积 极 回 应 网 络 材 料 学 生 们 可 以 在 他 人 文 章 的 上 下 文 语 境 中 找 到 自 己 的 立 场 并 能 够 针 对 特 定 问 题 提 出 自 己 的 观 点 oravec 2002 适当使用博客,可以使学生变得更善于分析和进行思辨,通过积极回忆网络材料,学生们可以在他人的文章的上下文语经中找到自己的立场,并能够针对特定问题提出自己的观点。 The appropriate use of the blog allows students to become better at analyzing and find their own position in the upper and lower languages of other people's articles and be able to raise their own views on specific issues.
32 佩 里 表 示 他 会 返 回 得 克 萨 斯 评 估 今 晚 党 团 会 议 的 结 果 明 确 自 己 在 这 次 较 量 中 是 否 有 胜 算 的 余 地 但 后 来 他 又 表 示 会 继 续 参 加 竞 选 并 参 加 于 1 月 21 日 在 南 卡 罗 莱 纳 州 举 行 的 初 选 佩里表示,他会返回德克萨斯,评估今晚党团会议的结果,明确表示,明确自己在这次较量中是否有胜算的余地,但后来他又表示会继续参加竞选,并参加于1月21日在南卡罗莱纳州举行的初选。 Perry said he would go back to Dexas and evaluate the results of tonight's party meeting to see if he had a chance to win in this competition. But then he said he would continue to participate in the election and participate in the first election held on January 21 in South Carolina.
33 它 的 舌 头 有 可 能 是 分 叉 的 对 此 我 们 尚 不 确 定 它 的 食 物 包 括 海 龟 大 型 鱼 类 其 他 沧 龙 甚 至 会 吃 人 他的舌頭有可能是分岔的,對此我們尚不確定他的食物包括海龜,大型魚類,其他蒼龍,甚至會吃人 Its tongue may be split, we are not sure about that. Its food includes sea turtles, large fish, other dragons, and even eat people.
34 大 金 字 塔 是 埃 及 人 在 公 元 前 三 世 纪 的 杰 作 它 是 众 多 向 已 故 法 老 表 示 敬 意 的 大 型 金 字 塔 的 其 中 之 一 大金字塔是埃及人在公元前三世纪的傑作它是众多向一顾法老表示敬意的大型金字塔的其中之一 The Great Golden Tower is the masterpiece of the Aegean people in the third and fourth centuries BC. It is one of the great golden towers that many have expressed their respect to the ancient pharaohs.
35 罗 斯 贝 数 越 小 恒 星 在 磁 场 倒 转 方 面 就 越 不 活 跃 螺丝倍数越小,恒星在磁场倒转方面就越不活跃 The smaller the number of screws, the less likely is Hengxin to make a profit.
36 它 让 玩 家 可 以 通 过 在 空 中 移 动 设 备 来 控 制 电 子 游 戏 中 的 运 动 和 操 作 它让玩家可以通过在空中移动设备来控制电子游戏中的动作和操作 It allows players to control the movement and operation of the electronic game in every step of the game.
37 这 并 不 是 告 别 这 是 一 个 篇 章 的 结 束 也 是 新 篇 章 的 开 始 这并不是告别,这是一个篇章的结束,也是新篇章的开始。 This is not goodbye, this is the end of a chapter and the beginning of a new chapter.
38 向 北 可 轻 松 抵 达 浪 漫 迷 人 的 辛 特 拉 镇 它 是 拜 伦 勋 爵 笔 下 为 人 称 道 的 乐 土 并 因 此 为 外 国 人 所 熟 知 向北可轻松抵达浪漫迷人的新特拉镇,它是拜伦勋爵笔下为人称道的乐土,并因此为外国人所熟知。 In chantours, a typically romantic and romantic mountain range could easily reach up to the north since thebreaker is known for her vehement instrument, the white
39 大 多 数 对 技 术 决 定 论 的 解 释 都 包 括 这 两 个 总 体 思 路 一 是 技 术 本 身 的 发 展 在 很 大 程 度 上 超 越 了 文 化 或 政 治 影 响 二 是 技 术 反 过 来 会 对 社 会 产 生 不 受 社 会 条 件 制 约 的 内 在 影 响 大多數對技術決定論的解釋都包括這兩個總體思路一是技術本身的發展在很大程度上超越了文化或政治影響二是技術反過來對社會產生不受社會條件制約的內在影響 Most of the explanations for the definition of technology include these two general ideas. One is that the development of technology itself has surpassed the cultural or political impact to a large extent. The other is that technology, on the other hand, has an internal impact on society that is not subject to social conditions.
40 人 工 智 能 有 很 强 的 科 幻 色 彩 但 它 其 实 是 计 算 机 科 学 非 常 重 要 的 一 个 分 支 研 究 的 是 机 器 的 行 为 学 习 和 智 能 适 应 人工智能有很强的科幻色彩但它其实是计算机科学非常重要的一个分支研究的是机器的行为、学习和智能适应 Artificial intelligence has a very strong exchangeable color, but it is actually a very important part of computer science. Research is the behavior, learning and intellectual adaptation of machines.
41 1940 年 8 月 15 日 盟 军 攻 入 法 国 南 部 这 次 进 攻 被 称 为 龙 骑 兵 行 动 1940年8月15日,盟军攻入法国南部,这是行动被称为龙骑兵行动。 August 15, 1940, the Mongol army attacked the south of France. This operation was called the Dragon Cavalry Operation.
42 全 天 都 有 公 交 车 从 城 区 间 公 交 站 跨 河 发 车 但 大 部 分 车 次 特 别 是 开 往 东 部 和 贾 卡 尔 布 姆 唐 的 公 交 车 都 在 06:30 至 07:30 之 间 发 车 全天都有公交车从城区间公交站跨河发车但大部分车子特别是开往东部和加喀尔布姆塘的公交车都在6点半到7点半之间发车 There are busses crossing the river from Chenquijian bus station all day, but most of the buses, especially the busses to the east and Jakar and Bumutang, start at 6.30 to 7.30.
43 海 地 正 义 与 民 主 研 究 所 haitian institute for justice and democracy 引 用 的 独 立 研 究 表 明 是 尼 泊 尔 的 联 合 国 维 和 部 队 在 不 知 情 的 情 况 下 将 这 种 疾 病 带 到 了 海 地 海地正義與民主研究所引用的獨立研究表明,是尼泊爾的聯合國維和部隊在不知情的情況下,將這種疾病帶到了海地。 海地正義與民主研究所引用的獨立研究表明,是尼泊爾的聯合國維和部隊在不知情的情況下將這種疾病帶到了海地。
44 福 克 兰 群 岛 的 官 方 货 币 是 福 克 兰 英 镑 与 英 镑 等 值 弗兰克群岛的官方货币是弗兰克英镑与英镑等值 The official currency of the Flank Group is the Flank Inbound and Inbound levels.
45 恐 龙 的 羽 毛 并 没 有 发 育 良 好 的 主 干 这 称 为 羽 轴 但 还 是 有 羽 毛 的 其 他 特 征 比 如 羽 枝 和 羽 小 枝 研 究 人 员 推 断 羽 轴 的 进 化 可 能 比 这 些 其 他 特 征 晚 恐龙的羽毛并没有发育良好的主干这成为宇宙但还是有羽毛的其他特征比如宇质和宇小质研究人员推断宇宙的进化可能比这些其他特征晚 The feathers of the dinosaur do not have a good main liver, which becomes the fin, but there are still other features of the feathers, such as the fin and the small fin. Researchers infer that the evolution of the fin may be later than these other features.
46 与 所 有 南 非 国 家 公 园 一 样 该 公 园 每 天 都 收 取 养 护 费 和 门 票 费 与所有南非国家公园一样该公园每天都收取养护费和门票费 As with all South African national parks, the park is collected every day, and the maintenance fee and ticket fees are collected every day.
47 亚 里 士 多 德 就 所 有 科 学 领 域 的 问 题 包 括 心 理 学 在 内 所 发 表 的 观 点 都 被 一 一 接 纳 亞里斯多德就所有科學領域的問題,包括心理學在內,所發表的觀點都被一一接納。 The pressure is a problem that can save all scientific fields, including psychology, and the views that are issued are taken over one by one.
48 他 们 乘 坐 马 车 回 到 了 巴 黎 一 群 人 包 围 了 他 们 大 喊 大 叫 地 威 胁 国 王 和 王 后 他們乘坐馬車回到了巴黎一群人包圍了他們大喊大叫的威脅國王和王后 They took the carriage back to Paris, and a group of people surrounded them and shouted to threaten the king and queen.
49 从 传 统 意 义 上 讲 海 军 的 任 务 是 确 保 国 家 保 持 运 输 人 员 和 货 物 的 能 力 同 时 干 扰 敌 人 运 输 其 人 员 和 货 物 的 能 力 从传统意义上讲,海军的任务是确保国家运输人员和货物的能力,同时干扰敌人运输及其人员和货物的能力。 In the traditional sense, the task of the navy is to ensure the ability of the country's transport personnel and goods, and at the same time to interfere with the ability of the enemy to transport its personnel and goods.
50 睡 眠 中 断 是 指 这 样 的 过 程 在 正 常 睡 眠 期 间 有 意 地 醒 来 并 且 在 短 时 间 之 后 10-60 分 钟 睡 着 睡眠中断是指这样的过程,在正常睡眠期间有意的醒来,并且在短时间之后10到60分钟睡着。 This is the process of sleeping, wake up on purpose during normal sleep, and sleep for 10 to 60 minutes after a short time.
51 卡 萨 布 兰 卡 是 全 摩 洛 哥 最 无 趣 的 购 物 地 之 一 卡萨布兰卡是全摩洛哥最无聊的购物地址 Casablanca is one of the most boring shopping places in Morocco.
52 但 鸟 类 还 是 有 很 多 地 方 跟 恐 龙 相 似 但鸟类还是有很多地方和恐龙相似 But birds still have a lot of places that are similar to dinosaurs
53 狮 群 的 行 为 与 狼 群 或 狗 群 非 常 类 似 这 些 动 物 与 狮 子 的 行 为 惊 人 地 相 似 但 与 其 他 大 型 猫 科 动 物 不 同 而 且 这 些 行 为 对 它 们 的 猎 物 来 说 也 是 非 常 致 命 的 獅群的行為與狼群或狗群非常類似這些動物與獅子的行為驚人的相似但與其他大型貓科動物不同而且這些行為對他們的獵物來說也是非常致命的 The behavior of the lion group is very similar to the behavior of the wolf group or the dog group. The behavior of these animals and lions is surprisingly similar, but different from other large cats and animals. And these behaviors are also very fatal to their prey.
54 周 日 晚 些 时 候 美 国 总 统 唐 纳 德 特 朗 普 通 过 新 闻 秘 书 发 表 声 明 宣 布 美 军 将 撤 离 叙 利 亚 周日晚些时候,美国总统塔纳德特朗普通过习文秘书发表声明,宣布美军将撤离叙利亚。 On Sunday, President Donald Trump announced that the U.S. military would withdraw from Syria via a press release.
55 地 铁 里 的 定 期 广 播 只 有 加 泰 罗 尼 亚 语 但 自 动 系 统 会 用 多 种 语 言 进 行 临 时 广 播 包 括 西 班 牙 语 英 语 法 语 阿 拉 伯 语 和 日 语 地铁里的定期广播只有加泰罗尼亚语,但自动系统会用多种语言进行临时广播,包括西班牙语、英语、法语、阿拉伯语和日语。 The regular broadcast in the subway is only in Catalan, but the automatic system will use multiple languages for temporary broadcast, including Spanish, English, French, Arabic and Japanese.
56 孙 德 尔 本 斯 sundarbans 已 经 被 联 合 国 教 科 文 组 织 宣 布 为 世 界 遗 产 印 度 境 内 的 这 部 分 森 林 被 称 为 孙 德 尔 本 斯 国 家 公 园 孫德爾本斯已經被聯合國教科文組織宣布為世界遺產,印度境內的這部分森林被稱為孫德爾本斯國家公園。 Sundarbans has been declared a world heritage by the United Nations Institute of Science and Technology. This part of the forest in India is called the Sundarbans National Park.
57 在 互 联 网 上 搜 索 应 对 敌 对 环 境 课 程 也 许 能 找 到 提 供 培 训 的 当 地 公 司 的 地 址 在互联网上搜索应对敌对环境教程,也许能找到提供培训的当地公司的地址。 On the Internet, search for the response to the enemy's environment. Maybe you can find the address of the local company that provides training.
58 孩 子 们 因 为 各 种 原 因 被 寄 养 原 因 有 被 忽 视 被 虐 待 甚 至 是 被 勒 索 孩子们因为各种原因被寄养,原因有被忽视、被虐待,甚至是被勒索 Children are abandoned for various reasons. There are reasons for being ignored, abused or even blackmailed.
59 他 还 参 与 了 许 多 国 家 的 纸 币 雕 版 制 作 近 期 作 品 包 括 加 拿 大 新 版 5 元 和 100 元 纸 币 正 面 的 总 理 肖 像 他还参与了许多国家的纸币雕版制作,近期作品包括加拿大新版5元和100元纸币正面的总体肖像。 He also participated in the production of many countries of paper murals, and his recent works include Canada's new version of 5 yuan and 100 yuan of paper murals.
60 亚 热 带 风 暴 杰 瑞 jerry 今 天 在 大 西 洋 形 成 这 是 大 西 洋 飓 风 季 节 中 第 十 个 被 命 名 的 风 暴 亚热带风暴结尾,今天在大西洋行程这是大西洋预风聚结中第十个被命名的风暴 The Yardai storm is coming to an end. It will be formed in the Great Vast Yangtze River today. This is the 10th storm of the Great Vast Yangtze River.
61 再 往 北 的 广 袤 地 区 人 烟 稀 少 有 些 地 方 是 杳 无 人 烟 的 荒 野 在往北的广茂地区人烟稀少,有些地方是养无人烟的荒野。 There are few people smoking in the northern part of Guangmao. In some places, it is the wilderness of people.
62 实 验 是 一 种 用 来 消 除 一 个 或 多 个 可 能 性 假 设 的 试 验 不 过 实 验 并 不 是 唯 一 的 方 法 提 出 问 题 及 进 行 观 察 也 可 以 指 导 科 学 研 究 实验是一种用来消除一个或多个可能性假设的实验不过实验并不是唯一的方法提出问题及进行观察也可以指导科学研究 The experiment is a kind of experiment used to eliminate one or more possible assumptions. However, the experiment is not the only way to raise questions and observe them. It can also lead to scientific research.
63 然 而 在 这 方 面 申 根 区 有 点 像 一 个 国 家 然而在这方面,深耕区有点像一个国家。 However, in this regard, the deep root area is a bit like a country.
64 如 果 想 近 距 离 观 看 演 出 你 得 早 点 到 在 靠 近 舞 台 的 地 方 占 好 营 地 如果想近距離觀看演出,你得早點到在靠近舞台的位置站好營地 If you want to watch the performance closely, you have to arrive early and stand in the location of the stage.
65 该 服 务 经 常 用 于 航 运 包 括 游 艇 以 及 有 远 程 数 据 和 语 音 需 求 的 探 险 该服务经常用于航运,包括游艇以及有远程数据和语音需求的探险。 The service is often used for transport, including yachts and explorations with remote data and voice requirements.
66 植 物 通 过 光 合 作 用 从 阳 光 中 获 取 养 分 它 们 还 能 提 供 荫 凉 植物通过光合作用从阳光互取养分,它们还能提供阴凉。 Plants can get nutrients from sunlight through light and water. Plants can get nutrients from sunlight through light and water.
67 它 们 脚 上 有 鳞 片 和 爪 子 会 产 卵 还 像 霸 王 龙 一 样 用 两 条 后 腿 走 路 他们脚上有铃片和爪子,会缠暖,还有像霸王龙一样用两条后腿走路 They have scales and claws on their feet, which will warm them up, and walk with two hind legs like a kingfisher.
68 芬 兰 是 绝 佳 的 帆 船 运 动 圣 地 素 有 千 湖 之 乡 的 美 誉 在 其 湖 泊 和 沿 海 群 岛 范 围 内 也 含 有 数 千 座 岛 屿 芬蘭是絕佳的帆船運動勝地,素有千湖之鄉的美譽。在其湖泊和沿海群島範圍內,也含有數千座島嶼。 Finland is a great place for sailing and sports. It has the most beautiful lake in the world. It also has thousands of islands within its lakes and coastal islands.
69 此 外 在 革 命 之 后 官 职 面 向 全 体 男 性 开 放 申 请 这 使 得 最 有 抱 负 最 成 功 之 人 有 机 会 飞 黄 腾 达 此外在革命之後,官職面向全體男性開放申請,這使得最有抱負、最成功之人有機會飛黃騰達。 In addition, after the revolution, the official position is open to all men. This makes the most ambitious and successful person have the opportunity to fly high.
70 摩 洛 哥 苏 丹 将 该 市 重 建 为 daru l-badya 西 班 牙 商 人 在 这 里 建 立 了 贸 易 基 地 并 将 其 命 名 为 卡 萨 布 兰 卡 摩洛哥苏丹将该市重建为达鲁巴亚塔西班牙商人在这里建立了贸易基地并将其命名为卡萨布兰卡 Morocco and Sudan will rebuild the city as Darubayata Spanish merchants established a trading base here and named it Casablanca
71 据 透 露 这 份 文 件 将 提 及 边 界 争 端 巴 勒 斯 坦 希 望 以 1967 年 中 东 战 争 前 的 边 界 为 基 础 据透露,这份文件将提及边界争端,爱乐斯坦希望以1967年中东战争前的边界为基础。 It is revealed that this document will mention the border dispute, and that Palestine hopes to base its borders on the 1967 Middle East War.
72 罗 马 各 地 安 装 了 数 个 大 型 电 视 屏 幕 供 人 们 观 看 仪 式 罗马各地安装了数个大型电视屏幕供人们观看仪式 There are several large TV screens installed in different parts of Rome for people to watch the ceremony.
73 北 部 与 萨 赫 勒 地 区 接 壤 南 部 和 西 部 临 大 西 洋 北部与撒赫勒地区接壤南部和西部领大西洋 The north is connected to the Sahara region, the south and west face the big sun.
74 任 何 在 高 纬 度 地 区 开 车 或 翻 越 山 口 的 人 都 应 该 考 虑 到 可 能 遭 遇 下 雪 结 冰 或 冻 结 温 度 的 情 况 任何在高位度地区开车或翻越山口的人都应该考虑到可能遭遇下雪结冰或冻结温度的情况 Anyone who drives or crosses the mountain in the high altitude area should consider the possibility of snow or freezing temperatures.
75 昆 虫 学 家 们 用 虫 子 bug 一 词 来 正 式 称 呼 这 一 类 的 昆 虫 昆虫学家们用虫字一词来正式称呼这一类的昆虫 Bugs use the word bug to formally call this kind of bug.
76 在 独 立 战 争 期 间 十 三 个 州 最 初 根 据 联 邦 条 例 组 成 了 弱 小 的 中 央 政 府 国 会 是 其 唯 一 的 组 成 部 分 在獨立戰爭期間,13個州最初根據聯邦條例組成了弱小的中央政府,國會是其唯一的組成部分。 During the independent war, the 13 states initially formed a small central government according to the federal regulations. The Congress was the only part of its formation.
77 人 们 自 古 以 来 就 知 道 金 银 铜 等 基 本 化 学 元 素 因 为 这 些 元 素 都 能 以 自 然 形 态 在 自 然 界 中 发 现 而 且 比 较 容 易 使 用 原 始 工 具 进 行 开 采 人们自古以来就知道金银铜等基本化石元素,因为这些元素都能以自然形态在自然界中发现,而且比较容易使用原石工具进行开采。 Since ancient times, people have known the basic chemical elements such as zinc and copper. Because these elements can be found in the natural world in a natural form. And it is easier to use raw materials for production.
78 智利首选登山目的地科茶莫山谷 cochamó valley 被称为南美洲的优胜美地 yosemite这里有各式各样的花岗岩大石壁和峭壁 这里首选登山目的地,科察墨山谷,被称为南美洲的优美圣地这里有各式各样的花缸岩、大石壁和峭壁 This is the first place to climb the mountain, Kecha Moshan Valley, which is known as the most beautiful place in South America. There are all kinds of rock salt, stone coins and banners here.
79 天 使 2006 将 连 续 体 方 案 解 释 为 可 以 帮 助 组 织 达 到 更 高 绩 效 水 平 的 一 种 方 法 天使2006将连续体方案解释为可以帮助组织达到更高技效水平的一种方法 Angel 2006 will explain the continuous body program as a way to help the organization achieve a higher level of performance.
80 老 虎 是 全 能 运 动 员 它 会 攀 爬 虽 然 攀 爬 能 力 不 是 很 强 游 泳 跳 远 拉 力 能 达 到 人 类 大 力 士 的 五 倍 老虎是全能运动员 他会攀爬 虽然攀爬能力不是很强 游泳 跳跃 拉力能拿到人类大力士的五倍 Tiger is a full power athlete, he will climb, although climbing ability is not very strong Swim, jump, pull, can get five times the power of human history
81 一 枚 炸 弹 在 总 督 办 公 室 外 爆 炸 一枚炸彈在总督办公室外爆炸 A bomb exploded outside the office of the governor.
82 重 返 家 园 的 冲 击 比 文 化 冲 击 来 得 更 快 蜜 月 期 更 短 持 续 时 间 更 长 也 可 能 更 严 重 重返家园的冲击比文化冲击来得更快,蜜月期更短,持续时间更长,也可能更严重。 Reversing the impact of the home is faster than the impact of culture. Life is shorter, time is longer, and it can be more serious.
83 它 会 攻 击 任 何 进 入 水 中 的 东 西 即 使 像 霸 王 龙 之 类 的 巨 型 恐 龙 也 不 是 它 的 对 手 它会攻击任何进入水中的东西即使像霸王龙之类的巨型恐龙也不是它的对手 It will attack anything that enters the water Even a giant dinosaur like the eight dragons is no match for it
84 文明”一词来自拉丁语 civilis”意为 公民的”与拉丁语"civis"意为 公民”及"civitas"意为 城市”或 城邦”都有关这也以某种方式定义了社会的规模 文明意思来自拉丁语civilis意为公民的,与拉丁语civilis意为公民,以及civitus意为城市或城邦都有关,这以某种方式定义了社会的规模。 The meaning of civilization comes from the Latin word civilis, which means citizen, and the Latin word civis, which means citizen, and civitas, which means city or country, which defines the scale of society in a certain way.
85 意 大 利 语 也 是 大 部 分 在 该 国 工 作 的 人 日 常 使 用 的 语 言 拉 丁 语 则 常 使 用 于 宗 教 仪 式 意大利语也是大部分在该国工作的人正日常使用的语言,拉丁语则常使用于宗教仪式。 Italian is also a language that most of the people who work in the country use daily. Latin is often used in religious ceremonies.
86 若 想 从 最 佳 角 度 欣 赏 香 港 的 美 景 可 以 离 开 该 岛 前 往 对 面 的 九 龙 海 滨 若想从最佳角度欣赏香港的美景,可以离开该岛前往对面的九龙海滨。 If you want to enjoy the beauty of Hong Kong from the best angle, you can leave the island and go to the opposite Jiu Long coast.
87 压 力 越 小 生 命 力 就 表 现 得 越 积 极 每 个 人 都 有 可 能 找 到 绝 对 的 平 静 和 满 足 压力越小,生命的表现力就越激起,每个人都有可能找到绝对的平静和满足。 The smaller the pressure, the stronger the performance of life, and everyone may find absolute peace and satisfaction.
88 哲 学 家 亚 里 士 多 德 提 出 一 种 理 论 即 任 何 事 物 都 是 由 土 水 空 气 和 火 四 种 元 素 中 的 一 种 或 多 种 组 成 的 哲学家亚里士多德提出一种理论即任何事物都是由土 水 空气和火四种元素中的一种或多种组成的 The philosopher Aristotle proposed a theory that all things are made up of earth, water, air and fire and that all things are made up of earth, water, air and fire.
89 钙 钾 等 元 素 属 于 金 属 银 和 金 等 元 素 当 然 也 是 金 属 盖甲等元素属于金属银和金等元素当然也是金属 The elements such as the cover armor belong to metal, and the elements such as the silver and gold are of course also metal.
90 结 果 演 员 在 舞 台 上 吸 食 大 麻 剧 院 本 身 也 鼓 励 观 众 一 起 加 入 结果,演员在舞台上吸食大麻,剧院本身也鼓励观众一起加入。 As a result, the actor sucked up the crowd on stage, and the theater itself encouraged the audience to join in.
91 这 里 几 乎 都 是 沙 滩 游 泳 很 安 全 大 部 分 地 方 都 有 新 西 兰 圣 诞 树 的 树 荫 这里几乎都是沙滩,游泳很安全,大部分地方都有新西兰圣诞树的树荫 Here is almost all beach, swimming is very safe, most places have the sound of New Zealand Christmas tree.
92 这 座 城 市 与 该 国 其 他 城 市 形 成 了 鲜 明 对 比 因 为 它 更 多 的 是 阿 拉 伯 风 格 而 不 是 非 洲 风 格 这座城市与该国其他城市形成了鲜明对比,因为它更多的是阿拉伯风格,而不是非洲风格。 This city and other cities of the country have formed a clear contrast, because it is more of an Arab style rather than an African style.
93 仅 仅 两 个 星 期 美 国 和 自 由 法 国 的 军 队 就 解 放 了 法 国 南 部 并 转 向 德 国 仅仅两个星期美国和自由法国的军队就解放了法国南部并转向德国 In just two weeks, the US and the Free France Army liberated the south of France and turned to Germany.
94 他 一 直 无 法 用 药 物 来 缓 解 疼 痛 因 为 比 赛 禁 止 参 赛 者 服 用 这 些 药 物 他一直无法用药物来缓解疼痛,因为比赛禁止,参赛者服用这些药物。 He can't use the medicine to relieve pain, because the competition is prohibited. Participants take these drugs.